基因测序案例 联系客服

发布时间 : 星期三 文章基因测序案例更新完毕开始阅读50b44589c8d376eeaeaa31f0

4.Small RNA技术路线

4.1 项目描述

对18个RNA样品进行检测,样品检测合格后采取以下技术路线对Small RNA进行测序:Small RNA测序样品制备(默认18-30 nt,可根据研究开发需要适当调整切胶范围,需进行个性化评估)――上机测序(每个样本产生不低于15-20M的clean reads)――生物信息学分析。

发育节点: 4龄期L1 6龄期L2 蛹期L3 1年成虫L4 2年成虫L5 4年成虫L6 原始重复数据:(1-3) (1-3) (1-3) (1-3) (1-3) (1-3)

Small RNA合并:Y1 Y2 Y3 Y4 Y5 Y6 Y1-Y6合并=U 注释比对库 Y1 Y2 Y3 Y4 Y5 Y6 U 对比15次: Y1-Y2,Y1-Y3,Y1-Y4,Y1-Y5,Y1-Y6;Y2-Y3,Y2-Y4,Y2-Y5,Y2-Y6;Y3-Y4,

Y3-Y5,Y3-Y6;Y4-Y5,Y4-Y6;Y5-Y6

1)分析流程思路:A)与首选物种的前体比对(首先将测序数据比对miRabse的上报到的前体序列进行比对,这个非常重要的一个优势就是可以在我们的数据分析过程中,能够快速的发现已经报道的miRNA的新的3P或者5P序列)。B)与miRBase报道的成熟体比对。C)与参考基因组比

该流程

要修改

16

2)分析顺序:6个发育阶段的small RNA测序数据─→按照miRNA,piRNA,rRNA,tRNA,snRNA,snoRNA,

microRNAs,miRNAs,scRNA这9个类型区分到6个发育阶段─→建54个数据包,1个发育阶段建9个─→再分析。

4.2 生物信息学分析内容 注意:除常规分析项外,下述(也包含常规分析)必须全部做 1.基本分析 尽可能区分6个发育阶段进行分析

1)数据产出统计,对原始测序数据去接头,去低质量,去污染,提供分析数据及展示图:原始序列通过Illumine FastQC进行质量评价,获取Q20、Q30数据后,通过一系列数据处理将由于样本制备、测序结题、非典型miRNA特征序列(垃圾序列)及测序仪器光学数码处理而产生的非纯序列(N特征序列)进行整理,比对常见的RNA序列,如miRNA序列,RFam(piRNA,rRNA,tRNA,snRNA,snoRNA,microRNAs,

miRNAs,scRNA)和重复序列(详见下述“4”),进行归

类、提供图表

2)Rfam 数据库比对:详见“3. small RNA分类” 3)Repbase数据库比对:详见“3. small RNA分类” 4)Clean RNA长度分布统计:对整理(过滤)后的clean数据的总数(Total)及种数(Unique)进行了长度分布统计。如右图所示

5)Small RNA的检出和发现:详见“5.新Small RNA预测”

6)miRNA检出率统计:计算本次实验中的检出频率,并绘制维恩图。

7)Small RNA长度统计:详见“2.small RNA 的长度分布等” 8)Small RNA差异表达分析

(1)差异表达分析:根据实验设计不同,采用合适的差异检验方法筛选差异显著基因,

例如Fisher精确检验、卡方(2*2)(N*N)、T检验以及ANOVA等算法。分别采用筛选阈值为P值小于0.1、0.05以及0.01进行差异表达分析。

17

(2)差异基因上下调频数统计:分别对18组数据基因差异基因统计,并对6个时间段趋

势统计分析。并绘制趋势图

(3)差异基因表达水平聚类分析:对18组数据进行聚类分析并绘制热图。

(4)差异基因维恩图:根据实验方案对18组数据在P值小于0.1、0.01、0.05三个条件

下绘制维恩图。

? Y 1、Y 2、Y 3、Y 4、Y 5、Y 6各发育节点的差异表达Venn 图(韦恩图绘制策略:Y 1-U 、

Y3-U、Y3-U、Y4-U、Y5-U、Y6-U);

? miRNA,piRNA,rRNA,tRNA,snRNA,snoRNA,microRNAs,miRNAs,scRNA,

siRNA暂不做)不同类型的差异表达Venn 图;

9)miRNA成簇分析:有一些miRNA在基因组中成簇分布,这些miRNA同步由同一条初级体miRNA

转录,他们转录成一个多顺反子结构,使他们具有协同活性。通过成簇分析,可以在cluster水平考察miRNA的差异表达情况。详见“7.已知miRNA (包括已知和预测出的miRNA)的家族分析”

10)miRNA进化分析:MiRNA具有高度保守性(利用

miRBase、miRNAMap、miRGe、piRNA、TIGR、Rfam等数据库,及Vienna包与Mfold包),对选定物种进行miRNA

保守性分析,对于测序得到的miRNA及其他物种中出现的频率进行数目统计并绘制柱状图。提供分析数据及展示图

? 同源性/保守性分析。

11)miRNA种子序列分析:界定2-7序列一直为同一调控家族。对昆虫的种子序列家族进行

归类。与 miRBase、mRNA/EST、rRNAetc、http://csrdb.ucdavis.edu/smrnas,

http://plantgrn.noble.org/psRNATarget,http://starbase.sysu.edu.cn/degradomeSeq.php,

http://www.mirbase.org(所有植物、动物的Small RNA数据库)等等数据库比对。维也纳软件包中的RNA二级结构程序包RNAlib (Vienna 1.3 RNAsecondary structure programming library)评估miRNA-靶基因二聚体的结合能等

12)Small RNA 碱基偏向性分析: GC/AT 含量分布图;

碱基组成、质量分布,原始碱基数(bp),高质量碱基数(bp),碱基组成比率分析 13)对实验得到的piRNA进行统计分析

14)差异基因靶基因预测,并对预测得到的靶基因进行

GO、KEGG分析及聚类分析(非模式物种靶基因预测过程如右图所示)。详见“6.靶基因预测、GO功能分类、聚类分析” ──────────→

2.small RNA 的长度分布。按照6个样品,分别统计分析

除常规程序性分析外,提供以下分析数据及展示图:

GO和KEGG enrichmentFiteringmiRNAtargetsTagetfuntionannotationTargetScantarget predictionSigni?cant Diff miRNAsmRNAgetorfBLASTUTR_SequencesRef species GO,KEGG DatabaseBLASTGO DatabaseKEGG Database(1)miRNA,piRNA,rRNA,tRNA,snRNA,snoRNA,microRNAs,miRNAs,scRNA分别在

18

6个发育阶段的比率统计;

(2)U 数据的miRNA,piRNA,rRNA,tRNA,snRNA,snoRNA,

microRNAs,miRNAs,scRNA,siRNA暂不做)长度分布。 (3)Y 1、Y 2、Y 3、Y 4、Y 5、Y 6各发育节点的miRNA,piRNA,

rRNA,tRNA,snRNA,snoRNA,microRNAs,miRNAs,scRNA,siRNA暂不做)长度分布。

3.small RNA分类(① small RNA分类应该与转录组COG分类和GO分

类有对应关系,以便于进行转录组、small RNA、蛋白质组的关联分

析。② 应按照miRNA,piRNA,rRNA,tRNA,snRNA,snoRNA,microRNAs,miRNAs,scRNA,siRNA暂不做)类型,进行分类→再细分。③ 应特别关注其分析方法和数据库→http://wenku.http://www.china-audit.com//view/096023 3987c24028915fc3ec.html)除常规性分析外,提供以下数据及图:

1)比对分析,提供分析数据及展示图

与 miRBase、mRNA/EST、rRNAetc、http://csrdb.ucdavis.edu/smrnas,http://plantgrn.noble.org/psRNATarget,http://starbase.sysu.edu.cn/degradomeSeq.php,http://www.mirbase.org(所有植物、动物的Small RNA数据库)等等数据库比对。用所有物种的Small RNA进行比对(或再用动物的Small RNA对比对结果进行筛选和矫正),进行Small RNA的分类、鉴定。提供分析数据和展示图(目的:鉴定了多少miRNA,piRNA,rRNA,tRNA,snRNA,snoRNA,microRNAs,miRNAs,scRNA,)

除常规程序性分析外,提供以下分析数据及展示图:

? 确定Y 1、Y 2、Y 3、Y 4、Y 5、Y 6、U 各自比对鉴定出的Small RNA; ? Y 1、Y 2、Y 3、Y 4、Y 5、Y 6、U 各自鉴定出的Small RNA间的差异比较;

2)各发育节点miRNA,piRNA,rRNA,tRNA,snRNA,snoRNA,microRNAs,miRNAs,scRNA,

siRNA暂不做)等Small RNA的组成及其差异分析

(1)Rfam等数据库(至少2个数据库)比对(一系列non-coding RNA分析):选取Rfam

数据库来注释测序得到的小RNA序列,对其中的miRNA,piRNA,rRNA,tRNA,snRNA,snoRNA,

microRNAs,miRNAs,scRNA分别进行总测序数据(总数)以及Unique数据(种数)统

计,并区分出6个时间点中均有表达的共有序列、特异性表达的特有序列分析,提供分析数据及展示图。【4龄期L1 6龄期L2 蛹期L3 1年成虫L4 2年成虫L5 4年成虫L6 六个时间段分别统计】。具体内容如下:

? U 数据 miRNA,piRNA, rRNA,tRNA,snRNA,snoRNA,microRNAs,miRNAs,scRNA,siRNA暂不做)组成分析,提供饼图和数据;

? Y 1、Y 2、Y 3、Y 4、Y 5、Y 6各发育节点miRNA,piRNA,rRNA,tRNA,snRNA,snoRNA,microRNAs,miRNAs,scRNA的组成分析,时序变化规律;

? Y 1、Y 2、Y 3、Y 4、Y 5、Y 6各发育节点共有序列及特有序列分析; ? 各发育节点差异序列表达趋势分析miRNA-STC,差异筛选; ? Small RNA 表达水平差异方差分析;

19