新一代DNA测序技术总览 联系客服

发布时间 : 星期四 文章新一代DNA测序技术总览更新完毕开始阅读28eb8fbd1a37f111f1855b8e

片段,需要进行较高深度测序后再做序列拼接。不过,它们的高数据产出量降低了耗材成本和测序运行的次数。

技术研发的成本和数据分析的成本常常从测序总成本计算中本忽略了。通常,这些成本比建立起第二代,第三代测序技术高得多。例如,图1中的由第二代测序技术而来的数据(2008年之后)是重测序工作的结果,其中,参照基因组被用于指导序列拼接过程。假如从头测序只以桑格毛细管电泳方法来进行,那么在此阶段,要评估只靠第二代或第三代测序技术来进行一个人类基因组的测序或从头拼接的操作可行性和相关成本,实际上是很困难的。显而易见的是,现在最大的成本障碍在于那些用于精确排列的光学检测系统和下游的数据分析所需的复杂硬件系统。 第三代测序技术

以将人类基因组测序的成本降到1000美元以下为终极目标,美国国立健康研究院/美国国立人类基因组学研究所(NIH/NIGRI)资助了几个小组以改进第二代测序技术或研发其他的测序方法,包括扫描隧道电子显微镜(Scanning Tunneling Electron Microscope, TEM),荧光共振能量转换

(FluorescenceResonanceEnergyTransfer,FRET),单分子检测

(Single-moleculeDetection)和蛋白质纳米孔(Protein Nonopores)的应用。有两种处于领先地位的第三代测序技术(太平洋生物科学公司和全基因组学公司)仍然依赖于荧光活动的光学检测,但其目的在于提高测序速度和数据产出量(见表格2)。在另一方面,Ion Torrent's 技术公司应用了电子敏感场效应晶体管(Ion-sensitive Field Effect Transitor, ISFETs),以摒弃测序过程中对光学检测的依赖。而牛津纳米孔公司(Oxford Nanopore)的纳米孔技术也是致力于取消光学设施和无需进行DNA扩增,他们以检测跨越纳米孔的导电性变化来进行测序。由霍尔康分子和ZS遗传学公司(Halcyon Molecular and ZS Genetics)所使用的纳米光学扫描隧道电子显微镜技术需要价值百万美元的设备,迄今为止,他们的数据产出量仍然有限,但很有可能阅读出长达数千碱基的相邻DNA片段。还有,一些仍然基于光学检测的测序方法也还在研发之中,将可以做到前所未有的长距离基因定位,这对于将个人基因组和癌症基因组进行精确拼接是非常必要的。现在,我们来详细审视第二代和第三代测序技术,介绍每一种技术的长处和缺点。

图1. 测定一个人的全基因组序列所需的成本---根据由美国国立基因组学研究所资助的大规模DNA测序中心所提供的数据而做的估计 单分子测序

太平洋生物科学公司太平洋生物科学公司(PacBio)率先研发出一种可靠的基于实时单分子测序技术的第三代测序平台。他们的过程是直接测由DNA聚合酶将荧光标记的核苷酸掺入互补测序模板。该技术的核心是一个零点启动模式的波导(Zero-mode Wavelength,ZMW)纳米结构的密集排列,这一排列阵可以进行单个荧光分子的光学审视。在过去,零点启动模式波导结构被用于从大量高密度的分子中分辨出单一的荧光分子,还没有被用于大量平行分析的操作。为使之用于大量平行分析和数据输出通量(测序数据生成能力),太平洋生物科学公司开发出一种方法,能有效地将零点启动模式波导结构排到表面上,他们采用了电子束光刻技术(Electron beam Lithography)和紫外光电子束光刻技术(Ultraviolet Photo lithography)以及高度平行的共焦成像系统,这样可以对零点启动模式纳米结构中的荧光标记分子进行高灵敏度和高分辨率的探测,并采用了一个沉重的稳定平台来确保良好的光学聚焦效果。

零点启动模式排列共振和检测模式确立后,主要的技术难点就转移到如何将单个的有功能的DNA聚合酶分子固定到每个零点启动模式阵列的底部,完成之后,才可以检测荧光标记的核苷酸底物。这一过程份是分两步来进行的:第一,一套

荧光标记的脱氧核糖核苷5磷酸(4种)底物被合成,每种碱基可以以波谱形式被彼此分辨出来,并且不会降低DNA聚合酶的活性;第二,需要对零点启动模式阵列的表面进行处理,以对DNA聚合酶进行选择性地定位。零点启动模式阵列是由一个熔铸的硅胶底层和一个铝质的表层构成,所有的零点启动模式纳米结构被固定于其中。由于铝质层是乙烯磷酸酯(Polyvinylphosphonic Acid, PVPA)的衍生物,蛋白质对铝质层的吸附性大大降低,而对阵列的玻璃底层的吸附则不受影响。将这种化学修饰和高度平行的零点启动模式阵列技术结合起来,太平洋生物科学公司推出了一套高读长(达到1000碱基),四色荧光示踪的实时单分子(Single-molecule Real-time, SMRT)测序技术。但由于将DNA聚合酶固定到每个阵列的底部的随机性,造成了其测序通量的局限性。在一份发表的研究论文中报道,大约只有三分之一的零点启动模式阵列中含有一个单一的DNA聚合酶分子,该聚合酶分子具有活性能产生一个完整长度的测序阅读。图2描绘了在这篇要文中所采用的四色实时单分子测序的策略。

继这项概念证明性的研究之后,太平洋生物科学公司又对测序模板进行了改进---他们创造了被称为实时单分子测序铃的模板(SMRTbell template)。这种实时单分子测序铃式模板,通过将一个通用的发夹环连到被测序双链片段的两端,可以对正链和反义链同时进行测序。因为不需要进行模板扩增,所以样品制备的时间得以缩短,而且很广泛长度范围的DNA片段都可用来作为测序模板。还有,实时单分子测序铃式模板的应用还提高了测序和对单核苷酸多态性检测的准确性。

太平洋生物科学公司现在商业化提供PacBio RS测序仪系统。这种仪器的耗材包括一次性使用的零点启动模式阵列(被称为实时单分子测序芯片,SMRT cells),一套含有150000个零点启动模式阵列和制备实时单分子测序铃式模板的试剂盒。最近,这种PacBio RS测序仪用于在对海地爆发的霍乱研究的五种霍乱弧菌(Vibrio Cholerae)菌株的快速基因分型中。对5中菌株的平均测序读长为700-1000碱基,平均测序覆盖深度为28到60倍,测序准确度一次性达标率平均为81-83%。报道中还显示,对3种菌株的一小部分测序运行的测序读长接近到3000碱基。

图2. 太平洋生物科学公司(PacBio's)实时单分子测序方案示意图。A. 单个零点启动模式波导纳米结构的侧面图,每个纳米结构含一个DNA聚合酶分子,固定于底部的玻璃面上。波导纳米结构和共焦成像系统确保只对底部进行荧光检测。

B. 显示了荧光标记的核苷酸底物掺入测序模板的过程。相应的瞬时荧光探测分为5个步骤。

除测序外,实时单分子探测技术在其他方面的应用也在研发之中。太平洋生物科学公司以其单分子检测技术增进了遗传学研究数据的可靠性,他们将由DNA聚合酶反应得来的数据和DNA甲基化模式对应起来。他们已具备能够将mRNA链测序到密码子水平的能力,简单而言,他们将每个零点启动模式阵列底部的DNA聚合酶换成了在mRNA链上进行翻译的核糖体,这样就能够监控每个荧光标记的tRNA分子的掺入。 边连接边测序法

全基因组学公司(Complete Genomics)全基因组学公司的测序平台是以杂交和连接反应为核心的。当通过杂交和连接进行测序的方法出现以后,全基因组学公司推出了新的样品处理方法和纳米阵列平台。基因组DNA首先经过超声处理,再加上一些接头,然后模板环化,酶切。最后产生大约400个碱基的环化的测序片段,每个片段内含有4个明确的接头位点。环化片段用Φ29聚合酶扩增2个数量级。一个环化片段所产生的扩增产物称为DNA纳米球(DAN nanoball, DNB)。纳米球被选择性地连接到六甲基二硅氮烷处理的硅芯片上。图3A描述了DNA纳米球阵列的设计。 表2. 新一代的测序技术

第大约读测序方检测X公司 平台名称 长(碱基法 方法 代 数) 优点 相对局限性 并不能高效地将高平均读长,DNA聚合酶加到测比第一代的序阵列中;准确性一实时单第太平洋生测序时间降次性达标的机会低分子荧光/~1000 低;不需要扩(81-83%);DNA三物科学公PacBio RS DNA测光学 代 司 增;最长单个聚合酶在阵列中降序 读长接近解;总体上每个碱基3000碱基 测序成本高(仪器昂贵); 在第三代中低读长;模板制备妨通量最高;在碍长重复序列区域所有测序技测序;样品制备费术中,用于拼事;尚无商业化供应接一个人基的仪器 因组的试剂成本最低;每复合探第全基因组GeXP遗传针锚杂荧光/三学公司 分析系统 交和连光学 代 接技术 10