RT-PCR引物设计原则和方法
近刚开始做PCR,参考了很多与引物设计相关的帖子,结合自己使用primer5和oligo的体会,想谈谈自己设计引物的方法和步骤,恳请各位前辈指正。
RT-PCR引物设计原则和方法
在NCBI上搜索到该基因,找到该基因的mRNA,在CDS选项中,找到编码区所在位置,在下面的origin中,Copy该编码序列作为软件查询序列的候选对象。
打开Primer Premier5,点击File-New-DNA sequence, 出现输入序列窗口,Copy目的序列在输入框内(选择As),此窗口内,序列也可以直接翻译成蛋白。点击Primer,进入引物窗口。
此窗口可以链接到“引物搜索”、“引物编辑”以及“搜索结果”选项,点击Search按钮,进入引物搜索框,选择“PCR primers”,“Pairs”,设定搜索区域和引物长度和产物长度。在Search Parameters里面,可以设定相应参数。一般若无特殊需要,参数选择默认即可,但产物长度可以适当变化,因为100~200bp的产物电泳跑得较散,所以可以选择300~500bp。
点击OK,软件即开始自动搜索引物,搜索完成后,会自动跳出结果窗口,搜索结果默认按照评分(Rating)排序,点击其中任一个搜索结果,可以在“引物窗口”中,显示出该引物的综合情况,包括上游引物和下游引物的序列和位置,引物的各种信息等。
对于引物的序列,可以简单查看一下,避免出现下列情况:3’端不要以A结尾,最好是G或者C,T也可以;3’不要出现连续的3个碱基相连的情况,比如GGG或 CCC,否则容易引起错配。此窗口中需要着重查看的包括:Tm应该在55~70度之间,GC%应该在45%~55%间,上游引物和下游引物的Tm值最好不要相差太多,大概在2度以下较好。该窗口的最下面列出了两条引物的二级结构信息,包括,发卡,二聚体,引物间交叉二聚体和错误引发位置。若按钮显示为红色,表示存在该二级结构,点击该红色按钮,即可看到相应二级结构位置图示。最理想的引物,应该都不存在这些二级结构,即这几个按钮都显示为“None”为好。但有时很难找到各个条件都满足的引物,所以要求可以适当放宽,比如引物存在错配的话,可以就具体情况考察该错配的效率如何,是否会明显影响产物。对于引物具体详细的评价需要借助于Oligo来完成,Oligo自身虽然带有引物搜索功能,但其搜索出的引物质量感觉不如Primer5。
在Primer5窗口中,若觉得某一对引物合适,可以在搜索结果窗口中,点击该引物,然后在菜单栏,选择File-Print-Current pair,使用PDF虚拟打印机,即可转换为Pdf文档,里面有该引物的详细信息。
在Oligo软件界面,File菜单下,选择Open,定位到目的cDNA序列(在primer中,该序列已经被保存为Seq文件),会跳出来两个窗口,分别为Internal Stability(Delta G)窗口和Tm窗口。在Tm窗口中,点击最左下角的按钮,会出来引物定位对话框,输入候选的上游引物序列位置(Primer5已经给出)即可,而引物长度可以通过点击Change-Current oligo length来改变。定
位后,点击Tm窗口的Upper按钮,确定上游引物,同样方法定位下游引物位置,点击Lower按钮,确定下游引物。引物确定后,即可以充分利用Analyze菜单中各种强大的引物分析功能了。
Analyze中,第一项为Key info,点击Selected primers,会给出两条引物的概括性信息,其中包括引物的Tm值,此值Oligo是采用nearest neighbor method计算,会比Primer5中引物的Tm值略高,此窗口中还给出引物的Delta G和3’端的Delta G。3’端的Delta G过高,会在错配位点形成双链结构并引起DNA聚合反应,因此此项绝对值应该小一些,最好不要超过9。
Analyze中第二项为Duplex Formation,即二聚体形成分析,可以选择上游引物或下游引物,分析
上游引物间二聚体形成情况和下游引物间的二聚体情况,还可以选择Upper/Lower,即上下游引物之间的二聚体形成情况。引物二聚体是影响PCR反应异常的重要因素,因此应该避免设计的引物存在二聚体,至少也要使设计的引物形成的二聚体是不稳定的,即其Delta G值应该偏低,一般不要使其超过4.5kcal/mol,结合碱基对不要超过3个。Oligo此项的分析窗口中分别给出了3’端和整个引物的二聚体图示和Delta G值。
Analyze中第三项为Hairpin Formation,即发夹结构分析。可以选择上游或者下游引物,同样,Delta G值不要超过4.5kcal/mol,碱基对不要超过3个。
Analyze中第四项为Composition and Tm,会给出上游引物、下游引物和产物的各个碱基的组成比例和Tm值。上下游引物的GC%需要控制在40%~60%,而且上下游引物之间的GC%不要相差太大。Tm值共有3个,分别采用三种方法计算出来,包括nearest neighbor method、%GC
method和2(A+T)+4(G+C)method,最后一种应该是Primer5所采用的方法,Tm值可以控制在50~70度之间。
第五项为False Priming Sites,即错误引发位点,在Primer5中虽然也有False priming分析,但不如oligo详细,并且oligo会给我正确引发效率和错误引发效率,一般的原则要使错误引发效率在100以下,当然有时候正确位点的引发效率很高的话,比如达到400~500,错误引发效率超过100幅度若不大的话,也可以接受。
Analyze中,有参考价值的最后一项是“PCR”,在此窗口中,是基于此对引物的PCR反应Summary,并且给出了此反应的最佳退火温度,另外,提供了对于此对引物的简短评价。若该引物有不利于PCR反应的二级结构存在,并且Delta G值偏大的话,Oligo在最后的评价中会注明,若没有注明此项,表明二级结构能值较小,基本可以接受。
引物评价完毕后,可以选择File-Print,打印为PDF文件保存,文件中将会包括所有Oligo软件中已经打开的窗口所包括的信息,多达数页。因此,打印前最好关掉Tm窗口和Delta G窗口,可以保留引物信息窗口、二级结构分析窗口(若存在可疑的异常的话)和PCR窗口。
引物确定后,对于上游和下游引物分别进行Blast分析,一般来说,多少都会找到一些其他基因的同源序列,此时,可以对上游引物和下游引物的blast结果进行对比分析,只要没有交叉的其他基因的同源序列就可以。
有一个问题,引物设计原则里面常常强调,引物所对应模板序列的Tm 值最好在72℃左右,但是软件里面Search出来的引物,很少有达到这个值的,一般都在50~65度之间,这是什么原因?软件怎么没有限定这个规则?
补充
PCR引物设计的黄金法则
1. 引物最好在模板cDNA的保守区内设计。
DNA序列的保守区是通过物种间相似序列的比较确定的。在NCBI上搜索不同物种的同一基因,通过序列分析软件(比如DNAman)比对(Alignment),各基因相同的序列就是该基因的保守区。
2. 引物长度一般在15~30碱基之间。
引物长度(primer length)常用的是18-27 bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于Taq DNA 聚合酶进行反应。
3. 引物GC含量在40%~60%之间,Tm值最好接近72℃。
GC含量(composition)过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。另外,上下游引物的Tm值(melting temperature)是寡核苷酸的解链温度,即在一定盐浓度条件下,50%寡核苷酸双链解链的温度。有效启动温度,一般高于Tm值5~10℃。若按公式Tm= 4(G+C)
+2(A+T)估计引物的Tm值,则有效引物的Tm为55~80℃,其Tm值最好接近72℃以使复性条件最佳。
4. 引物3′端要避开密码子的第3位。
如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增的特异性与效率。
5.引物3′端不能选择A,最好选择T。
引物3′端错配时,不同碱基引发效率存在着很大的差异,当末位的碱基为A时,即使在错配的情况下,也能有引发链的合成,而当末位链为T时,错配的引发效率大大降低,G、C错配的引发效率介于A、T之间,所以3′端最好选择T。
6. 碱基要随机分布。
引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错误引发(False priming)。降低引物与模板相似性的一种方法是,引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3′端不应超过3个连续的G 或C,因这样会使引物在GC富集序列区错误引发。
7. 引物自身及引物之间不应存在互补序列。
引物自身不应存在互补序列,否则引物自身会折叠成发夹结构(Hairpin)使引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。引物自身不能有连续4个碱基的互补。
两引物之间也不应具有互补性,尤其应避免3′ 端的互补重叠以防止引物二聚体(Dimer与Cross dimer)的形成。引物之间不能有连续4个碱基的互补。
引物二聚体及发夹结构如果不可避免的话,应尽量使其△G值不要过高(应小于4.5kcal/mol)。否则易导致产生引物二聚体带,并且降低引物有效浓度而使PCR 反应不能正常进行。
8. 引物5′ 端和中间△G值应该相对较高,而3′ 端△G值较低。
△G值是指DNA 双链形成所需的自由能,它反映了双链结构内部碱基对的相对稳定性,△G值越大,则双链越稳定。应当选用5′ 端和中间△G值相对较高,而3′ 端△G值较低(绝对值不超过9)的引物。引物3′ 端的△G 值过高,容易在错配位点形成双链结构并引发DNA 聚合反应。(不同位置的△G值可以用Oligo 6软件进行分析)
9. 引物的5′端可以修饰,而3′端不可修饰。
引物的5′ 端决定着PCR产物的长度,它对扩增特异性影响不大。因此,可以被修饰而不影响扩增的特异性。引物5′ 端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合DNA序列;引入点突变、插入突变、缺失突变序列;引入启动子序列等。
引物的延伸是从3′ 端开始的,不能进行任何修饰。3′ 端也不能有形成任何二级结构可能。
10. 扩增产物的单链不能形成二级结构。
某些引物无效的主要原因是扩增产物单链二级结构的影响,选择扩增片段时最好避开二级结构区域。用有关软件(比如RNAstructure)可以预测估计mRNA的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能(△G°)小于58.6l kJ/mol时,扩增往往不能成功。若不能避开这一区域时,用7-deaza-2′-脱氧GTP取代dGTP对扩增的成功是有帮助的。
11. 引物应具有特异性。
引物设计完成以后,应对其进行BLAST检测。如果与其它基因不具有互补性,就可以进行下一步的实验了。
值得一提的是,各种模板的引物设计难度不一。有的模板本身条件比较困难,例如GC含量偏高或偏低,导致找不到各种指标都十分合适的引物;用作克隆目的的PCR,因为产物序列相对固定,引物设计的选择自由度较低。在这种情况只能退而求其次,尽量去满足条件。
做Real Time时,用于SYBR Green I法时的一对引物与一般PCR的引物,在引物设计上所要求的参数是不同的。引物设计的要求:1)避免重复碱基,尤其是G. 2)Tm=58-60度。 3)GC=30-80%.
4)3'端最后5个碱基内不能有多于2个的G或C. 5)正向引物与探针离得越近越好,但不能重叠。
6)PCR扩增产物长度: 引物的产物大小不要太大,一般在80-250bp之间都可;80~150 bp最为合适(可以延长至300 bp)。
7)引物的退火温度要高,一般要在60度以上;
要特别注意避免引物二聚体和非特异性扩增的存在。
而且引物设计时应该考虑到引物要有不受基因组DNA污染影响的能力,即引物应该跨外显子,最好是引物能跨外显子的接头区,这样可以更有效的不受基因组DNA污染的影响。 至于设计软件,PRIMER3,PRIMER5,PRIMER EXPRESS都应该可以的。
做染料法最关键的就是寻找到合适的引物和做污染的预防工作。对于引物,你要有从一大堆引物中挑出一两个能用的引物的思想准备---寻找合适的引物非常不容易。
关于BLAST的作用应该是通过比对,发现你所设计的这个引物,在已经发现并在GENEBANK中公开的不物种基因序列当中,除了和你的目标基因之外,还有没有和其他物种或其他序列当中存在相同的序列,如和你的目标序列之外的序列相同的序列,则可能扩出其他序列的产物,那么这个引物的特异性就很差,从而不能用。