好文档 - 专业文书写作范文服务资料分享网站

水稻全基因组编码抗病基因同源序列分析

天下 分享 时间: 加入收藏 我要投稿 点赞

水稻全基因组编码抗病基因同源序列分析

任鄄胜1,2,肖培村*2,陈勇2,吕启明1,王玉平1,赵慧霞2,李仕贵*1

【摘 要】摘要:利用模糊搜索的方法,在 TIGR水稻日本晴基因组数据库(TIGR Rice Genome Annotation-Release 5)中识别出 565个编码抗病蛋白质的同源序列;利用识别出 565个编码抗病蛋白质序列分别与籼稻基因组数据库进行 BLASTP联配,共确定 320个对应的等位基因。通过在线生物信息学软件,识别了这 565个抗病基因的保守结构域、保守模体和 DNA序列内转座子元件,其中有14个抗病基因同源序列注释错误。同时绘出了这些基因的基因组分布,并基于这些基因的同源树分析和基因组物理分布,认为基因的原位和远程复制事件产生了抗病基因的现存分布和多样性,其中转座子在复制过程中扮演了重要角色。这些对抗病机制研究和抗病基因进化研究以及抗病基因的转育具有重要意义。 【期刊名称】生物信息学 【年(卷),期】2010(008)002 【总页数】7

【关键词】关键词:抗病基因同源序列;基因模体分析;复制事件;转座子元件;基因组

利用图位克隆和转座子标签法,克隆出了许多植物抗病基因根据其保守结构域,这些抗病基因编码的蛋白质被划归至少 5类蛋白质[1]。但是,仅依靠克隆的抗病基因来研究植物整个抗病基因体系的进化和变异机制以及作用机制,是远远不够的。而拟南芥、水稻等基因组测序工作的完成,从整个基因组水平上分析抗病基因提供了契机。Meyers等[2]利用生物信息学方法分析核苷酸结合位点—富亮氨酸重复(NBS—LRR)类型的抗病基因在拟南芥基因组中的分布,发现NBS-LRR

型抗病基因成簇存在。后来的基因组排序也表明大多数NBS-LRR型抗病基因在拟南芥和水稻基因组中成簇存在[3-7]。Hubert等认为抗病基因成簇存在有利于植物抗病基因通过重组和基因交换来产生新的抗性。水稻基因组中存在着大量抗病基因。Tian等[7]等在水稻日本晴基因组中发现535个NBS类抗病基因,其中480个属于NBSLRR类型。吴为人等[8]在利用 45个已克隆的抗病基因对水稻基因组序列进行分析,共发现 2 119个抗病基因同源序列(RG A);并在籼稻品种 9 311基因组中找到702个等位抗病同源序列。对于大量植物抗病基因的存在和成簇形式的出现,是众多病原体的特定识别的必然,以及大量复制事件、异位重组和特定基因保存和优先扩增的结果[2]。进行整个基因组序列识别抗病基因同源序列以及DNA序列和蛋白质序列比对,将有助于理解抗病基因多样性产生的机制。

通过在线生物信息学软件和水稻基因组数据库,识别和搜索了水稻品种日本晴基因组中的抗病基因,这些基因被注释为不同类型和不同功能的抗病基因或其同源序列。这些基因序列及其编码蛋白序列的比对,以及基因组DNA序列转座子序列的查找,有助于深入理解植物基因大家族的功能和进化。

1 材料和方法

1.1 数据库搜索和序列获得

对 TIGR粳稻品种日本晴 (Oryza sativa ssp japonica cv.Nipponbare)数据库,进行了抗病基因同源序列模糊搜索。在 TIGR水稻数据库 (TIGR Rice Genome Annotation-Release 5)水稻假定鉴别搜索页面下,输入关键词“NBS-LRR”或“NBS”或“LRR”或“disease resistance protein”,模糊搜索有关水稻NBS-LRR基因和水稻抗性基因同源序列;同时在TIGR水稻数据库中下载了搜索

到的基因组DNA序列和蛋白质序列,并记录了每个序列的注释信息,如基因类型、推测的功能,染色体物理位置等。 利用 565

个编码抗病蛋白质序列,通过 http://

www.gramene.org/multi/blastview分别与籼稻基因组数据库[Gramene release V28(September 2008)]进行BLASTP联配,以确定籼稻中对应的等位基因。为消除非等位联配,取 E≤1×10-130, ID≥80%。 1.2 蛋白序列结构和DNA序列内转座子元件预测

将所获得的蛋白质序列以文本文件形式提交在线蛋白质结构预测软件 HmmPfam(http://hmmpfam. ddbj.nig.ac.jp/top-e.html),以邮件形式返回结果衔接。当与蛋白结构域匹配 E≤3时,确定为抗病同源蛋白质序列的结构域。同样将获得的基因组DNA序列以文本文件形式提交在线转座子元件预测软件Repea

tMaskerWeb

Server(http://www.repea

tmasker.

org/cgi-

bin/WEBRepea tMasker),同样以邮件形式返回结果衔接。取 S W得分≥1 000认定为序列中含有转座子元件序列。我们还利用在线软件 Smart(http://s mart.embl-heidelberg.de)和 Pfam(http:// pfam.sanger.ac.uk)进行了个别蛋白质序列分析。

1.3 序列同源树和系统发生树构建

利用生物软件DNAMAN6.0对所获得抗病基因DNA序列和蛋白质序列进行了多序列比对,从而产生了抗病基因的同源遗传树和系统发生遗传树。序列多重比对时DNAMAN中的参数均用的是默认设置,利用W indow XP画笔系统进行编辑。所有文本文件利用UltraEdit-32专业版编辑器处理。

2 结果与分析

水稻全基因组编码抗病基因同源序列分析

水稻全基因组编码抗病基因同源序列分析任鄄胜1,2,肖培村*2,陈勇2,吕启明1,王玉平1,赵慧霞2,李仕贵*1【摘要】摘要:利用模糊搜索的方法,在TIGR水稻日本晴基因组数据库(TIGRRiceGenomeAnnotation-Release5)中识别出565个编码抗病蛋白质的同源序列;利用识别出565个编码抗病蛋
推荐度:
点击下载文档文档为doc格式
9hsdh7n4y48iiwn479cv9uewu2s0a001e10
领取福利

微信扫码领取福利

微信扫码分享