好文档 - 专业文书写作范文服务资料分享网站

高通量测序基础知识 

天下 分享 时间: 加入收藏 我要投稿 点赞

PhiX文库有什么用?

PhiX文库是一种用病毒基因组做的文库。其基因序列已精确知晓,GC比例约为40%,与人类、哺乳类的基因组的GC比例接近。其基因序列又与人类的基因序列相去甚远,在与哺乳类基因组一些测序时,可以轻松地通过基因序列比对而将之去除。

在测四种碱基不平衡(A、G、C、T四种碱基的含量远远偏离25%)的样本时,可以加入大量的PhiX文库,以部分抵消样本的不平衡性。例如ChIPed DNA测序,或者亚硫酸氢盐处理过的DNA文库,或者扩增子测序(PCR样测序),都可以加入PhiX,以部分弥补碱基不平衡性。

也可以少量地加入样本,以作为control library来验证测序质量。 Hiseq和Miseq有什么差别?

Hiseq 2000的测序数据产量很高,一条Lane一次可以产生35G的Q30数据,一张Flowcell可以产生约300G的Q30数据。但是测一次序要9~11天的时间。所以较慢。

Hiseq 2500的一张PE 200 Flowcell可以给出60G的Q30数据,测序本身是一天时间,可以快速地以较高的通量给出高质量的测序数据。

Miseq的测序数据产量低,一次可以产生1G~4G的数据。但是测长可以做到较长,目前可以测250*2。而且测序的速度非常快,一般一天就可以测完一张Flowcell。

Hiseq 2000和Hiseq 2500有什么差别? 仪器升级:

Hiseq 2500是Hiseq 2000的升级版。 其主要的改进点是:Hiseq 2500可以在快速、高通量两种模式之间切换。高通量模式就是原来的Hiseq 2000的每张Flowcell有8个Lane的模式。 Hiseq 2500的快速模式,核心的改进是用2个Lane的Flowcell来测序,而且这种快速Flowcell的Lane比Hiseq 2000的Lane要短,数据产量也略低于高通量模式的2条Lane。 Hiseq 2500快速模式的试剂也有所改进。 速度提升: Hiseq高通量模式,PE100,双Flowcell,11天完成测序。数据量每Flowcell在270G PF data以上。 Hiseq快速模式,PE100,双Flowcel,27小时完成测序。数据量每Flowcell在60G PF data以上。 数据质量提升: 在快速模式下,Hiseq机器可以更快地拍完一个cycle的所有照片,也就是每个cycle的用时更少。SR50可以在1天内走完,PE100可以在2天内走完。这明显比原来的3天(SR50)、11天(PE100)要快得多。 在速度加快的同时,还带来质量的提升。因为Hiseq测序过程中两个主要的物质:酶和荧光剂都是不稳定的,或者说是在融化后(原来是冰冻的)随时间延长而不断降解的。为此Hiseq还为试剂准备了4度冰格,以减慢其降解。原来的Hiseq 2000要走11天,现在2天完成,这带来了明显的测序质量提升。 实测哺乳类动物的基因组DNA文库, Q30比例可达85%以上,而且其中绝大部分是90%以上。

测序长度提升:

而且因为测序质量的提升,也带动测序长度的提升,目前Illumina官方支持的Hiseq 2500的测长是PE 2*150。 特别需要注意的,Illumina目前不直接提供PE150的试剂,客户要用1*PE Cluster kit + 1*PE100 SBS kit + 2*SR50 SBS kit合起来,才能测PE150。

直接兼容更多文库:

Hiseq 2500的快速模式试剂直接支持双Index测序模式:

双Index是指两个接头各有一个Index。这样两套Index排列组合,一个Lane里可以放更多的文库。目前Illumina官方试剂是支持96个排列组合( 12*8 = 96),这对充分利用Hiseq平台巨大的测序数据产量有很大的帮助。原来的单Index是支持单侧24种Index。

这与Hiseq PE100高通量模式标准PE100试剂只能测单Index。当然,Hiseq2000b也可以测双Index,但是用4个50 cycles SBS kit(每Kit保证58个cycles)拼起来(58*4=232),才可以保证有足够的SBS试剂量,因为双Index会实际需要216 cycles,这超过了200 cycle SBS试剂可以保证的cycle数。

仪器操作更方便:

Hiseq 2500快速模式可以直接在Hiseq仪上进行Cluster生成,这大大节约了先要在cBOT上生成Cluster,再要将Flowcell从cBOT上移到Hiseq的麻烦。

但是请注意,如果直接在Hiseq 2500上生成cluster,两条Lane就只能上一种预混合文库,而不能象原来的Hiseq 2000上那样,两条Lane物理分开。也就是说预混合文库中的Index一定是要分得开的才行。

当然,快速模式也可以还用cBOT生成cluster,但是那要另外买一个编号为CT-402-4001(全名:TruSeq? Rapid Duo cBot? Sample Loading Kit )的试剂盒,这个试剂盒要好几百美元。

试剂操作更方便 :

Hiseq 2500快速模式的试剂是做成Master Mix的,也就是酶、Buffer、荧光dNTP等都预先混合好了,一大管,拿来一化冻就可以用,很方便。这与高通量模式试剂把酶、荧光dNTP分几管的模式是不一样的,高通量模式的试剂因为是分管的,所以使用之前还要人工再混合,这样会多占用一点人工。

Hiseq 2500的两个机位同时只能运行一种模式:

Hiseq 2500在一台机器的两个机位同时只能跑同一种模式,也就是要么都跑快速模式,要么都跑高通量模式,而不能一个机位跑快速模式,另一个机位同时跑高通量模式。

Illumina、Roche 454、Life Ion Torrent、SOLID和PacBio的高通量测序仪的优缺点是什么? Illumina的测序仪的数据产量高,数据质量也是最高的。因为采用带终止基团的荧光dNTP,所以在测Homopolyer(碱基同聚物,例如一串4个T:TTTT)等的时候,不会产生移码错读。 Roche 454采用的是pyrosequencing的测序原理,通过水解DNA全成过程中所产生的焦磷,放出光,通过测这光来读出序列。优点是读长最长。但是数据产量是最低的。 Ion Torrent,包括PGM和Proton,采用测量DNA合成过程中所释放的氢离子引起的PH值的变化,来得到序列。优点是速度最快,上机前约3~4天的时间,上机只要2~4个小时。 SOLID采用的是杂交,连接反应,再测荧光的方法。因为杂交,所以速度慢,测长

较短。现在事实上已被淘汰。 PacBio是三代测序,也就是单分子测序。目前的情况是测序长度可以在1个KB以上,而且可以测出DNA序列的修饰情况。但是其缺点在于测序的准确度很低,目前的测序准确度只有每个碱基80~90%。另一方面通量较小,一次读7万条reads.

Illumina测序过程中,Multiplex index之间会有多少交叉的污染? 我们曾经专门做过实验,用4个亲缘关系很远的物种的DNA,用4个index标记,进行测序。测序之后进行基因组比对,发现每种index之内会有0.02~0.03%的reads是别的物种的。也就是说因为Multiplex index引入的交叉污染,会以0.02%上下的比例存在。 这主要是由化学合成index oligo过程中的误差引起的。根据我司的引物合成专家的经验,即使经过HPLC的纯化,oligo中还是会有0.5~1%甚至更高的错的引物。现在的0.02%的污染率,已经是很低了。

Hiseq和Miseq都可以做双index测序吗? Miseq是天生就可以做双index测序的。 Hiseq要升级到2500之后,才可以做双index测序。而且,在测的时候要加一个试剂盒:Truseq Dual Index Sequencing Primer Box(下称Dual Index Box)。 这个试剂盒只能用于一整个Hiseq 2000的Flowcell,也就是说无论一张Flowcell中有几条Lane是双index的,只要其中有一条Lane是双index的,就需要用一个Dual Index Box. 我们对一个Dual Index Box, 收取1000元人民币的费用。 Dual Index Box中主要是新加的测第2条Index的引物。

高通量测序基础知识 

PhiX文库有什么用?PhiX文库是一种用病毒基因组做的文库。其基因序列已精确知晓,GC比例约为40%,与人类、哺乳类的基因组的GC比例接近。其基因序列又与人类的基因序列相去甚远,在与哺乳类基因组一些测序时,可以轻松地通过基因序列比对而将之去除。在测四种碱基不平衡(A、G、C、T四种碱基的含量远远偏离25%)的样本时,可以加入大量的PhiX文库,以部分抵消样本
推荐度:
点击下载文档文档为doc格式
0cfp11ox724vbt11g9oi
领取福利

微信扫码领取福利

微信扫码分享