段两端的35个碱基进行双向测序(pair end)。从很多角度看来,这种SBH技术与前面提到的“循环芯片测序”(cyclic array sequencing)很相似,都是将DNA片段原位固定在高通量芯片表面进行扩增,再用CCD拍摄荧光信号。区别仅仅在于基于碱基聚合、连接还是杂交原理来进行每一轮反应。
除此以外,SBH还有另一种思路,即将探针连接在芯片上,与待测序列原位杂交,来检测插入、缺失和替换等突变位点。许多芯片公司已经以此原理开发了SNP芯片等。 7.2 实时测序技术(real time sequencing)
单分子实时测序的原理是,在DNA合成过程中,以DNA聚合酶作为一个纳米机器,随着聚合酶在模板链上的移动,捕捉每个合成的荧光标记的碱基信号。首先,将每种单核苷酸都标记上不同的荧光分子,荧光分子标记在5’-磷酸基团上,而并非碱基上。当某种核苷酸与模板链配对结合时,就会在DNA聚合酶处发出荧光信号,从而达到边合成边测序的目的,信号捕捉完毕,就会切割荧光基团,成为正常的核苷酸,再继续反应。其次,实时测序不需任何PCR扩增,是真正的单分子测序。由于反应体系中有很多荧光标记的单核苷酸,实时测序的核心在于如何从很强的荧光背景中检测结合上的核苷酸荧光信号。对此,两家不同的美国公司采用了不同的方法。Visigen公司使用了荧光共振能量转移(FRET)技术,使用了荧光标记的DNA聚合酶,由于只有结合到模板的单核苷酸上的荧光分子才能与聚合酶中的荧光分子足够接近,产生FRET作用,从而发出强于背景的荧光信号。而Pacific Bioscience公司使用一种被称为零模式光导(zero mode waveguide)的纳米小室作为DNA合成的反应体系,这个反应空间直径只有70nm,足够小的空间将单核苷酸荧光背景与结合上模板的核苷酸荧光信号区分开,从而实现了足够的检测信噪比。这些纳米小室在芯片上阵列,实现了高通量。Pacific Bioscience公司已经在最近的文章中证明了这种技术的可行性和进展。由于合成上的都是正常的核苷酸,这种技术可以实现比Sanger法更长的读长。并且碱基合成速度达到每秒10个,加上芯片的高通量,单分子实时测序可以很轻易的实现高速度和低成本。目前,这种技术还处在研发阶段,Visigen公司希望最近的几年将产品推向市场,并在2010年左右实现1000美元测序人的基因组。
7.3 纳米孔测序技术(Nanopore Sequencing)
纳米孔测序技术是近年来发展最快,最热门的领域之一。很多研究者认为,这是在未来几年内最有希望实现1000美元个人基因组项目的下一代测序技术。美国人类基因组研究中心(NHGRI)2008年批准的8个1000美元基因组项目中,有5个与此相关。
当在充满电解液的纳米级小孔两端加上一定的电压时(比如100 mV),通过此纳米孔的电流强度很容易测定。当纳米孔的直径恰好只能容纳一个核苷酸通过时,长链核酸(DNA或RNA)在电场作用下就会依次通过此纳米孔。纳米孔一旦被核苷酸阻断(block),通过的电流强度就会变弱。而且由于四种不同核苷酸碱基的差异导致的空间构象差别,纳米孔被阻断时电流变小的程度不同,四种碱基分别有其特征的电流峰值。在DNA依次通过纳米孔时检测相应的电流来判断对应的碱基,就能够实现测序,这就是纳米孔测序技术的基本原理。
与传统Sanger法和第二代测序技术相比,纳米孔测序的优势显而易见:低成本、高速度和高通量。纳米孔测序过程中不需要任何生化反应的参与,几乎不需要任何试剂成本,只有样品制备、设备折旧和纳米孔芯片的成本,这将大大优于大多数第二代测序技术。在电场作用下DNA通过纳米孔的速度决定了测序速度,而在120 mV电压下通过速率达到1-20 μs/核苷酸,这意味着理论上一个纳米孔就可以达到百万碱基每秒的测序速度,非常惊人。如果能在一张芯片上阵列大量的纳米孔,就能轻松达到高通量测序。此外,纳米孔测序还具有需要样品量少,超高读长的优点。由于不需要任何聚合或连接反应,只是在长链核酸电泳过程中测序,理论上读长可以达到上万个碱基。这些优势使得作为第三代测序技术的纳米孔测序非常具有诱惑力:能在极短时间内(比如数小时)以极低的成本(比如几百美元)完成一个哺乳动物基因组de novo测序(高读长使得拼接方便)。
尽管如此,纳米孔测序技术距离实际应用还有相当的距离,很多技术细节都面临着挑战。比如,前面提到DNA通过纳米孔的速度很快,达到μs每核苷酸的级别,可是目前传感器的灵敏度远远达不到在这个速度下检测电流变化。只有通过各种方法(比如某种酶)降低DNA的通过速率,达到ms每核苷酸,才能
使用已有的检测器。此外,在芯片上大规模集成纳米孔也是技术的难点。
为了解决纳米孔测序的一系列技术难题,通过与其它电子技术和生化技术的结合,纳米孔测序出现了几种不同的技术解决方案,但这些方案又都面临着问题。总体来看,有以下四种方案。
第一种方案完全是以前述的纳米孔测序原理为基础,通过检测DNA电泳通过纳米孔的电流变化来测序。这种方法的最大挑战是,由于纳米孔总有一定的厚度,往往能同时容下10-15个核苷酸链。因此,对应的特征电流是这么多核苷酸的综合效果,而不能达到一次检测单个碱基的目的。由于纳米孔的电场宽度是由孔径决定的,会向纳米孔两端各延伸一个孔径的距离。根据计算,要能容纳一个核苷酸通过的纳米孔最小孔径是1.5 nm,这意味着纳米孔的厚度最小也要3 nm,还是不能达到单碱基测序的灵敏度。
但是,研究证实这种方法可以有效区分通过纳米孔的单链和双链DNA。这就为将纳米孔测序与杂交测序(SBH)结合起来创造了条件。前面已经提到,SBH在de novo测序方面有很大困难,因为不能得到探针在杂交片段上的位置和数量等信息。而将每轮杂交后的片段通过纳米孔,就能得到这些信息,从而实现de novo测序。这就是杂交辅助纳米孔测序的原理(Hybridization assisted nanopore sequencing)
第二种方案为了达到单碱基测序的目的,采用了一种酶切检测的方法。在DNA即将通过纳米孔时,用一种连接在纳米孔上的内切酶将末端核苷酸切割下来,随后以单核苷酸的形式通过纳米孔,检测阻断电流特征峰,随后再切割下一个碱基??就能实现单碱基测序。这种方法的挑战是找到合适的工作酶,保证切割下的单核苷酸全部依次的进入纳米孔并流出,检测的单核苷酸电流信号能代表DNA的序列,和合适的纳米孔和酶的连接方法。
还有另一种方案能解决问题。通过某种方法将DNA上四种核苷酸转换成四种寡聚核苷酸链(oligos),比如包含一对各12个核苷酸的12-mer oligos(A和B)。经过转换后,A、T、G、C分别被24-mer oligos所取代,变成AA、AB、BA和BB。A和B上都标记了不同的荧光分子,就可以实现用两种荧光信号识别四种oligos。目前,Lingvitae公司通过限制性内切酶和连接酶的参与,已经可以在一种高度阵列的自动化系统中实现在24小时内转换一个人的全基因组片段。接着,将转换后的片段与荧光标记的A和B互补的寡聚核苷酸探针杂交,自由的荧光oligo探针由于自身猝灭导致背景不高,杂交上的oligo由于FRET效应也没有高背景,只有在通过纳米孔时将探针脱离模板才能产生强荧光信号,并且可以直接读出碱基序列。这种方法的缺点在于加入了酶促反应,增加了成本,同时成倍变长的DNA也降低了测序速度。
最后一种方法是在纳米孔的两端加上两个功能化电极探针。在单链DNA通过纳米孔时,一个电极探针与核苷酸的磷酸基团相连,另一个电极连接碱基,都以氢键形式。当在电极两端施加电场时,会产生瞬时横向电流信号而被捕捉。通过使用四种不同的碱基识别电极,分别平行的在纳米孔中对单链DNA测序,就可以读出整条序列。但是,如何控制DNA穿过纳米孔的速度,使四对识别电极同步化是这种方法面临的最大问题。 8 总结
测序技术的发展给基因组学、分子生物学和医学的飞跃带来了契机。以454、Solexa、SOLiD、HeliScope为代表的第二代测序技术将Sanger法的速度提高了100倍,成本也降低了100倍。但是第二代测序技术的一些弱点比如读长、准确度等使得Sanger法仍然在一些测序应用中有用武之地。但是,正如Sanger法经历了30余年的发展,第二代测序平台也必将发展的更为完善。目前,454、Solexa和SOLiD都已经推出了自己的新一代机型:Roch Genome Sequencer FLX、Illumina GAⅡ和SOLiDTM System。这些更新的第二代测序平台拥有更高的通量、准确度和更低的成本。显然,技术的发展将使第二代测序技术的潜力进一步发挥出来。与此同时,下一代测序技术包括纳米孔测序、杂交测序、实时测序以及相结合的应用正在飞速研发,数年后就有可能进入市场,从而实现24小时内以低于1000美元的成本测定一个哺乳动物基因组的目标。此外,在政府和私人机构的支持和推动下,新技术也必将出现。层出不穷的新测序技术将带来生物学的一场革命。基因组测序将进入普通实验室,甚至家庭和个人,物种基因信息将实现指数级增长。届时,对基因信息的解读及验证也会极大推动分子生物学的发展和生物制药的发展。