姓名: 谢奕 王鹏潮
学号: 3120100285 310
日期: 2015.03.19
地点: 农生环A253 课程名称: 分子育种学 指导老师: 崔海瑞 成绩: 实验名称: EST-SSR标记的开发 实验类型: 综合型
分工: 谢奕-EST获取+结果分析+引物设计 王鹏潮-SSR筛选+SSR统计+结果分析
一、实验目的和要求
1、了解SSR标记的开发策略;
2、明确EST-SSR标记的特点和建立EST-SSR标记的原理; 3、熟悉EST-SSR标记的过程,掌握EST-SSR标记的开发技术。
二、实验内容和原理 1、实验内容
通过从现有的EST文库中获取序列,再用软件对其进行SSR查找与引物设计。 2、实验原理 1)微卫星DNA
真核基因组中存在着大量的串联重复序列, 按重复单位的大小, 串联重复可分为卫星(重复序列>70bp)、小卫星(6~70bp)和微卫星DNA(1-6bp)。
微卫星(Microsatellite, MS)是指基因组中以少数几个核苷酸(多数为2~4个)为单位多次串联重复组成的长达几十个核苷酸的序列,又称简单序列重复(Simple Sequence Repeats , SSR)或短串联重复(Short Tandem Repeats , STR)、或简单序列长度多态性(Simple Sequence Length Polymorphism,SSLP)。
重复数目是可变的,重复序列两侧都有物种特异性的保守序列,所以通过设计引物进行PCR 扩增,就可以检测到不同的DNA 区域重复数目的多态性。 2)SSR标记的开发策略
SSR包括基因组SSR(genomic SSR或gSSR)和表达区EST-SSR(genic-SSR或EST-SSR)。gSSR是基于基因组序列开发的,开发起来费时费力,而且因为探针的缘故,种类比较局限。而EST—SSR则是存在于表达的基因序列内的SSR,不包括内含子及非表达的调控区等之中的SSR,通常三个碱基重复的占多数,与不引起基因翻译过程中移码现象的发生相一致。
建立SSR标记的前提是必需知道重复序列两列的DNA序列。 与其他标记相比,SSR标记具有如下特点: (1)数量较为丰富,覆盖整个染色体组; (2)具有多等位基因特性,信息含量高; (3)以孟德尔方式遗传,呈共显性;
(4)易于利用PCR技术分析,对DNA数量和纯度要求不高,结果重复性好; (5)每个位点由引物序列决定,便于交换。
近年来,EST-SSR标记的开发引起关注。数量迅速增加的ESTs为开发新的SSR标记提供了宝贵的资源,各种植物中约有5-10%的EST含有可用于建立标记的SSR。建立EST-SSR标记要经济得多,而且EST-SSR标记来源于DNA的转录区域,比gSSR标记具有更高的通用性,此外,标记-信息量高。
开发EST-SSR原理基于生物信息学手段的可开发SSR的方法。在数据库中已存在大量的可免费下载EST序列数据并剔除冗余EST序列,再通过SSR搜索软件获得SSR位点信息,然后根据SSR位点两侧的核酸序列信息的统计与分析,利用软件设计相应的SSR引物,进而开发SSR标记,最后进行PCR扩增及扩增产物电泳检测。 3)不同的SSR标记开发方法比较 传统方法开发SSR:
传统的SSR 分子标记开发方法简单、易掌握。这种方法在许多作物的SSR 标记开发中被广泛应用,现已获得的基因组SSR 标记中,四分之三以上的是利用传统开发方法获得的。但必须对每个克隆进行筛选鉴定,工作量大,需花费大量人力,财力,而且效率较低,植物中已报道的阳性克隆比率约为2 %~3 % ,成功获得引物的机率则更低。
图1 传统SSR开发方法流程图
通过富集策略开发SSR标记:
为简化技术环节,提高效率,降低开发成本,通过研究建立了多种采取富积策略的SSR标记开发方法。
基于RAPD 的开发策略:将RAPD 随机引物与SSR连接,作为PCR扩增引物或者将RAPD扩增产物条带用SSR探针进行Southern杂交,可以有效富集重复序列。虽然目前尚不清楚RAPD有利于SSR 富集的机理,但这一发现大大激发了人们探求富集SSR方法的兴趣。
PIMA ( PCR Isolation of Microsatellite Arrays)方法:先用RAPD引物从基因组中获得随机扩增片段,扩增片段经载体克隆后,用特异SSR及载体引物对克隆阵列进行PCR检测筛选含SSR克隆,对阳性克隆测序。
以上两种利用RAPD 富集SSR的报道,避免了基因组文库的构建,有利于节省时间和人力、物力,但基于此方法进行大量SSR 分离的成功报道并不多。 4)PCR引物设计原则
引物长度:15-30bp,常用为20bp左右。太短会降低退火温度影响引物与模板配对,从而使非特异性增高;太长则比较浪费,且难以合成。
引物扩增跨度:1kb之内是理想的扩增跨度,2kb左右是有效的扩增跨度,而超过3kb 就无法得到有效的扩增. 特定条件下可扩增长至10kb的片段。
引物碱基:G+C含量以40-60%为宜,G+C太少扩增效果不佳,G+C过多易出现非特异条带。ATGC最好随机分布,避免5个以上的嘌呤或嘧啶核苷酸的成串排列。
避免引物内部出现二级结构,避免两条引物间互补,特别是3‘端的互补,否则会形成引物二聚体,产生非特异的扩增条带。
引物3’端的碱基,特别是最末及倒数第二个碱基,应严格要求配对,以避免因末端碱基不配对而导致PCR失败。
引物中有或能加上合适的酶切位点,被扩增的靶序列最好有适宜的酶切位点,这对酶切分析或分子克隆很有好处。引物5'端对扩增特异性影响不大,可在引物设计时加上限制酶位
点、核糖体结合位点、起始密码子、缺失或插入突变位点以及标记生物素、荧光素、地高辛等。通常应在5'端限制酶位点外再加1-2个保护碱基。
引物的特异性:引物应与核酸序列数据库的其它序列无明显同源性
所扩增产物本身无稳定的二级结构,以免产生非特异性扩增,影响产量。
引物量:每条引物的浓度0.1~1umol或10-100pmol,以最低引物量产生所需要的结果为好,引物浓度偏高会引起错配和非特异性扩增,且可增加引物之间形成二聚体的机会。
三、主要仪器设备
计算机
四、操作方法与实验步骤 1、EST序列的获取
可从数据库中直接下载,主要的数据库有:
美国国立生物技术信息中心 GenBank/NCBI ( National Center for Biotechnology Information ):http://www.ncbi.nlm.nih.gov;目前有72098808条EST序列,其中 植物EST序列24158363条,涉及到895个物种。其中单子叶植物:7263423条:玉米-2024114;水稻-1333022;小麦-11116126。
欧洲生物信息研究所 European Bioinformatics Institute (EBI):http://www.ebi.ac.uk/index.html ,包含European Nucleotide Archive;
日本DNA数据库DDBJ(DNA Data Bank of Japan):http://www.ddbj.nig.ac.jp/; 先以从NCBI下载EST序列为例:首先
2、去冗余(EST序列前处理,在本次实验中由于软件收费略去)
采用EST分析软件前处理和剔除冗余EST:直接获取的EST中包含一些低质量片段(<100 bp),少量载体序列及末端存在polyA/T“尾巴”的序列,在开发标记之前应去除这些“噪音”——去冗余。
这些处理可通过一些软件来进行:cross-match(http://www.phrap.org/)或EST-trimmer (http://www.pgrc.ipk-gathersleben.de/misa/download/est-trimmer.pl),去除“尾巴”和屏蔽载体序列。
可用生物信息学软件去冗余:如Cluster W、CD-HIT [http://bioinformatics.ljcrf.edu/cd-hi/](若只考虑建立标记而不求统计相关参数,也可搜索后聚类,剔除冗余的SSR)。 3、SSR的搜寻
可利用以下一些软件在线搜索SSR:
(1)RepeatMasker(http://repeatmasker.org/cgi-bin/WEBRepeatMasker) (2)SSRIT(http://www.gramene.org/db/searches/ssrtool): ①选择搜索参数:最大值; ②粘贴序列 (<100Kb); ③获得结果和统计相关参数。
(3)Sputnik (http://cbi.labri.fr/outils/Pise/spumik.html)
也可利用MISA、DNAman、ssrhunter或ssrfinder等进行本地化搜索SSR,注意制定搜索SSR的标准。 4、设计SSR引物