威斯腾生物:整体实验外包专业服务
第四届中国药物基因组学学术大会暨_首届中国个体化用药—精准医学科学产业联盟大会
伯豪生物转化医学服务平台

2010,高通量测序技术日渐成熟

2010/12/24 来源:生物谷
分享: 
导读
测序在生命科学研究中一直发挥着重要作用。以Sanger法(双脱氧核苷酸末端终止法)为代表的第一代测序技术帮助人们完成了从噬菌体基因组到人类基因组图谱等大量测序工作,但由于其存在成本高、速度慢、通量低等不足,并不是后基因组时代最理想的测序方法。进入21世纪后,以Roche 454、

测序在生命科学研究中一直发挥着重要作用。以Sanger法(双脱氧核苷酸末端终止法)为代表的第一代测序技术帮助人们完成了从噬菌体基因组到人类基因组图谱等大量测序工作,但由于其存在成本高、速度慢、通量低等不足,并不是后基因组时代最理想的测序方法。

进入21世纪后,以Roche>454、Illumina Solexa和ABI SOLiD为代表的第二代测序技术诞生了,并迅速掀起了你追我赶的技术比拼高潮。2010年,Illunima和ABI先后发布新款测序仪,改进了原有机型,测序通量不断提升,测序成本不断降低,现在已经进入了数千美元测一个人全基因组的时代。

第二代测序技术进展

1.>Roche 454测序技术

454公司可谓第二代测序技术的奠基者。2005年底,454公司推出了革命性的基于焦磷酸测序法的高通量基因组测序系统--Genome Sequencer 20 System。这一技术的建立开创了边合成边测序(sequencing by synthesis)的先河,被nature杂志以里程碑事件报道。之后,454公司被罗氏诊断公司以1.55亿美元收购。一年后,他们又推出了性能更优的第二代基因组测序系统--Genome Sequencer FLX System(GS FLX)。2008年10月,Roche 454在不改变机器的情况下,推出了全新的测序试剂--GS FLX Titanium,全面提升了测序的准确性、读长和测序通量。

目前,Roche 454 GS FLX Titanium每次运行能产生100万条序列,平均读长能达到400nt,且第400个碱基的准确率能达到99%。一次运行所需时间为10小时,能获得4-6亿个碱基的序列信息。

2.>Illumina Solexa测序技术

Illumina公司的第二代测序仪最早由Solexa公司研发,利用其专利核心技术"DNA簇"和"可逆性末端终结(reversible terminator)",实现自动化样本制备和大规模并行测序。Illumina公司于2007年初花费6亿美金巨资收购了Solexa。2010年初,Illumina将其第二代测序仪Genome Analyzer IIx升级到HiSeq 2000。

HiSeq 2000含有两张Flow cell,可同时运行或者只运行其中一张。读长为100nt,同时支持Fragment、Pair-end和Mate-Paired文库。每次运行最多可产生200 GB的数据量(读长为2x100nt)。

Solexa测序技术路线:

3.>ABI SOLiD测序技术

过去20年,美国应用生物系统公司(ABI)在一代测序方面一直占据着垄断地位。第二代测序技术出现以来,ABI公司不甘落后,迅速赶上,于2007年底推出了SOLiD 第二代测序平台。2010年末又发布了最新产品--SOLiD 5500xl测序平台。从SOLiD到如今的SOLiD 5500xl,短短三年时间,连升五级,发展速度惊人。

SOLiD全称为Supported Oligo Ligation Detetion,它的独特之处在于它以四色荧光标记寡核苷酸的连续连接反应为基础,而没有采用传统的边合成边测序技术。连接反应没有DNA聚合酶合成过程中常有的错配问题,而SOLiD特有的"双色球编码技术"又提供了一个纠错机制,这样设计上的优势使得SOLiD在系统准确性上大大领先于其它平台。

目前最新款SOLiD 5500xl含有两张微流体芯片(microfluidic FlowChip),每张芯片含有6条相互独立的运行通道(run lane)。每条lane都能运行相对独立的测序反应,这样的设计使得SOLiD 5500xl测序平台极具灵活性。最大测序读长为75nt,同样支持Fragment、Pair-end和Mate-Paired文库。单次运行能得到的最大数据量为300Gb(使用最新设计的nanobeads)。测序的系统准确性能达到99.99%。

SOLiD测序技术路线:

第二代测序技术的应用

技术推进科学研究的发展。随着第二代测序技术的迅猛发展,科学界也开始越来越多地应用第二代测序技术来解决生物学问题。比如在基因组水平上对还没有参考序列的物种进行重头测序(de novo sequencing),获得该物种的参考序列,为后续研究和分子育种奠定基础;对有参考序列的物种,进行全基因组重测序(resequencing),在全基因组水平上扫描并检测突变位点,发现个体差异的分子基础。在转录组水平上进行全转录组测序(whole transcriptome resequencing),从而开展可变剪接、编码序列单核苷酸多态性(cSNP)等研究;或者进行小分子RNA测序(small RNA sequencing),通过分离特定大小的RNA分子进行测序,从而发现新的microRNA分子。在转录组水平上,与染色质免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技术相结合,从而检测出与特定转录因子结合的DNA区域和基因组上的甲基化位点。

这边需要特别指出的是第二代测序结合微阵列技术而衍生出来的应用--目标序列捕获测序技术(Targeted Resequencing)。这项技术首先利用微阵列技术合成大量寡核苷酸探针,这些寡核苷酸探针能够与基因组上的特定区域互补结合,从而富集到特定区段,然后用第二代测序技术对这些区段进行测序。目前提供序列捕获的厂家有Agilent和Nimblegen ,应用最多的是人全外显子组捕获测序。科学家们目前认为外显子组测序比全基因组重测序更有优势,不仅仅是费用较低,更是因为外显子组测序的数据分析计算量较小,与生物学表型结合更为直接。

目前,外显子组测序开始广泛应用于寻找疾病的候选基因上。内梅亨大学的研究人员使用这种方法鉴定出Schinzel-Giedion 综合征中的致病突变,Schinzel-Giedion综合征是一种导致严重的智力缺陷、肿瘤高发以及多种先天性畸形的罕见病。他们使用Agilent SureSelect序列捕获和SOLiD对四位患者的外显子组进行测序,平均覆盖度为43倍,读长为50 nt,每个个体产生了2.7-3 GB可作图的序列数据。他们聚焦于全部四位患者都携带变异体的12个基因,最终将候选基因缩小至1个。而贝勒医学院基因组测序中心也计划对15种以上疾病进行研究,包括脑癌、肝癌、胰腺癌、结肠癌、卵巢癌、膀胱癌、心脏病、糖尿病、自闭症以及其他遗传疾病,以更好地理解致病突变以及突变对疾病的影响。前不久刚刚结束的Science杂志年度十大科学突破评选中,外显子组测序名列其中。

以上我们盘点了2010年第二代测序技术的最新进展和相关应用。但是除了第二代测序之外,还有另外一种以单分子实时测序和纳米孔为标志的第三代测序技术也正在如火如荼的发展中,只是还没有正式发布。所以目前科学界所说的高通量测序还指的是第二代测序。

第三代测序技术简介

第二代测序技术在制备测序文库的时候都需要经过PCR扩增,而这一PCR过程可能引入突变或者改变样品中核酸分子的比例关系。另外,第二代测序的读长普遍偏短,在进行数据拼接时会遇到麻烦。为了克服这样的缺点,业界发展出了以单分子实时测序和纳米孔为标志的第三代测序技术。简介如下:

1.Helicos公司

Helicos公司的Heliscope单分子测序仪基于边合成边测序的思想,将待测序列随机打断成小片段并在3'末端加上Poly(A),用末端转移酶在接头末端加上Cy3荧光标记。用小片段与表面带有寡聚Poly(T)的平板杂交。然后,加入DNA聚合酶和Cy5荧光标记的dNTP进行DNA合成反应,每一轮反应加一种dNTP。将未参与合成的dNTP和DNA聚合酶洗脱,检测上一步记录的杂交位置上是否有荧光信号,如果有则说明该位置上结合了所加入的这种dNTP。用化学试剂去掉荧光标记,以便进行下一轮反应。经过不断地重复合成、洗脱、成像、淬灭过程完成测序。Heliscope的读取长度约为30-35 nt,每个循环的数据产出量为21-28 Gb。

2。Pacific Biosciences公司

Pacific Biosciences公司的SMRT技术基于边合成边测序的思想,以SMRT芯片为测序载体进行测序反应。SMRT芯片是一种带有很多ZMW(zero-mode waveguides)孔的厚度为100 nm的金属片。将DNA聚合酶、待测序列和不同荧光标记的dNTP放入ZMW孔的底部,进行合成反应。与其他技术不同的是,荧光标记的位置是磷酸基团而不是碱基。当一个dNTP被添加到合成链上的同时,它会进入ZMW孔的荧光信号检测区并在激光束的激发下发出荧光,根据荧光的种类就可以判定dNTP的种类。此外由于dNTP在荧光信号检测区停留的时间(毫秒级)与它进入和离开的时间( 微秒级) 相比会很长,所以信号强度会很大。其它未参与合成的dNTP由于没进入荧光型号检测区而不会发出荧光。在下一个dNTP被添加到合成链之前,这个dNTP的磷酸基团会被氟聚合物(fluoropolymer)切割并释放,荧光分子离开荧光信号检测区。

3.Oxford Nanopore Technologies公司

Oxford Nanopore Technologies公司正在研究的纳米孔单分子技术是一种基于电信号测序的技术。他们设计了一种以α-溶血素为材料制作的纳米孔,在孔内共价结合有分子接头环糊精。用核酸外切酶切割ssDNA时,被切下来的单个碱基会落入纳米孔,并和纳米孔内的环糊精相互作用,短暂地影响流过纳米孔的电流强度,这种电流强度的变化幅度就成为每种碱基的特征。

总结与展望

三代测序技术的原理各有特点,适用范围也不近相同。第一代测序技术凭借其长的序列片段和高的准确率,适合对新物种进行基因组长距框架的搭建以及后期GAP填补,但是成本昂贵,而且难以胜任微量DNA样品的测序工作。第二代测序技术中,454序列片段最长,比较适合对未知基因组从头测序,搭建主体结构,但是在判断连续单碱基重复区时准确度不高。Solexa较454具有通量高、片段短、价位低的特点,可以用于大基因组和小基因组的测序和重测序。Solexa双末端测序(paired-end sequencing)可以为基因组进一步拼接提供定位信息,但是随着反应轮数增加,序列长度和质量均有所下降,而且在阅读AT区时有明显错误倾向。SOLiD基于双碱基编码系统的纠错能力以及较高的测序通量,适合转录本研究以及比较基因组学特别是SNP检测等,但是测序的片段短限制了该技术在基因组拼接中的广泛应用。第三代测序技术目前正在研发阶段,尚未正式投入使用。

在实际应用中,多种测序平台的结合可以得到更好的效果。比如由于各种测序技术的错误分布并不相同,我们可以采用两种测序方法相互印证,可以解决单一测序方法无法验证SNP正确性的弊端。

2010年是高通量测序技术日渐成熟的一年,虽然尚未诞生具有革命性的测序仪,但是测序仪的性能不断改进,其同样意义重大。2006年底,美国X大奖基金会设立了基因组Archon X大奖,奖金高达1000万美元。这项大奖将颁给第一个能在10天之内,用不到100万美元的费用,完成100个人类基因组测序的民间团队。照现在的发展趋势来看,基因组Archon X大奖很快就会颁发出去了。

虽然测序技术越来越成熟,成本也越来越低,但是大量的数据存储和分析是紧接着的又一个挑战;而且,现在我们所能解释的生物学现象和机制还很有限,即使获得了基因组信息,如何去解释和应用它,仍是个长远的问题。这些问题都需要大家一起努力,共同探讨,拓展高通量测序的应用领域。

本文作者来自上海伯豪生物技术有限公司(上海生物芯片有限公司/生物芯片上海国家工程研究中心旗下子公司,简称SBC),联系方式:guangfeng_zhang@shbiochip.com

本网站所有注明“来源:生物探索”的文字、图片和音视频资料,版权均属于生物探索所有,其他平台转载需得到授权。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系(editor@biodiscover.com),我们将立即进行删除处理。所有文章仅代表作者观点,不代表本站立场。