好文档 - 专业文书写作范文服务资料分享网站

线粒体基因全分析及进化树的构建毕业论文

天下 分享 时间: 加入收藏 我要投稿 点赞

1、前言(Introduction)

英国《自然》杂志网络版2006年5月18日报道,科学家已对含有2.23亿个碱基对,占人类基因组中碱基对总量的8%左右的人类第一号染色体完成测序,宣告持续16年的人类基因组计划全部完成。作为人类自然科学史上重要的里程碑,“人类基因组”的研究已从“结构基因组”阶段进入“功能基因组”阶段。在人类基因组计划后相继推出的水稻基因组计划、马铃薯基因组计划、草鱼基因组计划等,和快速增长的微生物基因测序,“海量”的基因信息的积累,催生了“功能基因组”时代的来临。针对充分利用“海量”基因组信息的生物信息学不仅应运而生,而且为以注释、阐明基因功和利用基因生物学功能的“后基因组时代”的研究发挥了重大作用。

生物信息学是把基因组DNA序列信息分析作为源头,在获得了蛋白质编码区的信息后,进行蛋白质空间结构的预测和模拟,然后依据特定蛋白质的功能进行必要的药物设计。就是说,生物信息学的主要任务是组织和分析生物学数据,而生物学数据的分析离不开计算机算法的运用。因此,可以说生物信息学是一门集生命科学、计算机科学、数学、物理学为一身的多学科交叉的前沿学科。

动物mtDNA属母系遗传,是共价闭合的双链DNA分子,核酸序列和组成比较保守,基因的排列顺序比较稳定而且紧密,无重组和单拷贝。由于其结构和进化上的特点,mtDNA已成为研究动物起源进化以及群体遗传分化的理想对象。昆虫mtDNA大小约为15.4~16.3kb,其基因组大小的变化受A+T-rich区长度变化的影响十分显著。A+T-rich区(A+T丰富区)的长度最短为399 bp,最长达4601 bp,两者相差4202bp,前者见于Tricholepidion gertschi,后者见于黑尾果蝇Drosophila melanogaster。昆虫线粒体基因组由2个rRNA基因(1rRNA和srRNA)、22个tRNA基因、13个蛋白编码基因[Cytb基因(细胞色素b基因,cytochrome oxidase b),ATPase6和ATPase8(ATP酶亚基基因6和8,ATP synthase subunits 6 and 8),COⅠ、COⅡ和COⅢ(细胞色素氧化酶亚基基因Ⅰ-Ⅲ,cytochrome oxidasesubunit Ⅰ-Ⅲ),NDl-6和ND4L(NADH降解酶基因1~6和4L,NADH dehydrogenase subunit 1-6 and 4L)],共37个基因和1个包含复制启动子的非编码区(A+T-rich区)组成。Aloni 和 Attardi将mtDNA两条链中密度较小者命名为轻链(L链),另一条命名为重链(H链)。考虑到昆虫mtDNA没有明显的L链与H链之分,Simon等根据昆虫mtDNA中多数基因都是从一条链上转录的特点,将这一条链定义为J链,另一条链定义为N链[1-3]。

自Wolstenholme和Clary第一个报道了果蝇Drosophila yakuba mtDNA全序列以来,GenBank已收录了80余种昆虫mtDNA全序列,其中双翅目昆虫有15个种。在双翅目实蝇科昆虫中,地中海实蝇Ceratis capitata和油橄榄果实蝇Bactrocera oleae的线粒体基因组全序列已有报道[4]。

梨小食心虫,学名Grapholitha molesta (Busck),简称“梨小”,别名有梨小蛀果蛾、东方果蠹蛾、梨姬食心虫、桃折梢虫、小食心虫、桃折心虫。属于鳞翅目(Lepidoptera),

小卷叶蛾科(Olethreutidae)。梨小在各地果园均有发生,是梨树的重要害虫,在梨、桃树混栽的果园为害尤为严重。梨小除为害梨、桃树外,也为害李、杏、苹果、山楂等,严重影响果品质量及梨果产量,尤其是长江、黄河流域最严重[5]。

因此,我的论文是通过NCBI下载的梨小食心虫的全线粒体基因,并对其结构和功能进行分析。

2、材料和方法(Marerials and Methods)

2.1、研究思路

2.2、搜索基因

2.2.1、在NCBI中搜索梨小食心虫线粒体全基因序列

方法:

首先进入NCBI的官网,在Search中选择All Databases,在查询框中输入Grapholita molesta mitochondrion,点击Search,然后选择Geneome,总共出现一条记录,即选择NC 014806, Display 选择为Genbank,选择Download中的Genbank格式,即可下载得到梨小食心虫的线粒体全基因序列。

2.2.2、用DNAMAN分析其基因结构

得出结论 梨小食心虫线粒体基因 的结构和功能分析 进化树的构建 梨小食心虫线粒体 蛋白质序列 1、蛋白质一级结构分析 2、蛋白质二级结构分析 3、蛋白质三级结构分析 4、蛋白质功能性质分析 梨小食心虫线粒体 基因序列 1、基因序列的获取 2、基因序列的分析 3、同源性分析 4、开放阅读框的分析 与同源性最相近的物种进行进化树的构建 对于获取的海量数据,我们要先进行一些基本的分析,确定基因的分子量、碱基的组成等信息。

方法:

选取梨小食心虫的线粒体基因,选取显示的方式为包含cds,点击确认,即可。 2.2.3、碱基同源性分析的方法

方法:

进入网址:,在序列中提交NC 014806,其他选项默认设置。

通过在线的BLAST的比对,可以找到与梨小食心虫线粒体同源性最高的物种,从而可通过研究其同源性高的物种,间接研究该物种,为该物种的进一步研究提供一定的理论依据。

2.2.4、开放性阅读框(ORF)分析的方法

方法:

利用NCBI的ORF Finder程序对NC 014806做开放性阅读框分析。 网址如下:

参数选择:Genetic Codes:1 Standard

开放阅读框[open reading frame,0RF] 是结构基因的正常核苷酸序列,从起始密码子到终止密码子的阅读框可编码完整的多肽链,其间不存在使翻译中断的终止密码子。

ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件[6]。

通过ORF的分析,我们可以确定全基因中哪段基因片段可以翻译为蛋白质,从而为特定蛋白质的功能的确定提供依据。

2.3、基因编码蛋白质的理化性质分析

利用ExPaSy中的Protparam和Protscale进行蛋白质的氨基酸组成、分子质量、等电点以及疏水性分析[7]。

2.3.1、氨基酸组成、分子质量、等电点分析方法

利用ExPaSy软件包中的Protparam工具进行氨基酸组成、分子质量、等电点分析 网址如下:

通过氨基酸组成、分子质量、等电点分析,我们可以确定编码蛋白的最基本性质,为进一步研究蛋白质的二级结构、三级结构提供依据。 2.3.2、亲疏水性分析方法

利用瑞士生物信息学研究所(Swiss Institute of Bioinformatics, SIB)的ExPASy服务器上的ProtScale程序对ORF 翻译后的氨基酸序列SEQUENCE进行亲疏水性分析

网址如下:

参数选择:

Hphob. / Kyte & Doolittle

正值表明疏水,负值表明亲水。通过疏水性分析,可以让我们了解蛋白质是否属于亲水蛋白。

2.4、基因编码蛋白质的结构分析

2.4.1、蛋白质的二级结构分析

方法:

利用Expasy服务器下的SWISS-MODEL中的Psipred进行蛋白序列的二级结构分析 网址:

http://swissmodel.expasy.org/workspace/index.php?func=tools_targetidentification1 蛋白质二级结构:指蛋白质肽链本身的折叠和盘绕的方式。二级结构主要有α-螺旋、β-折叠、β-转角。常见的二级结构有α-螺旋和β-折叠。二级结构是通过骨架上的羰基和酰胺基团之间形成的氢键维持的,氢键是稳定二级结构的主要作用力。

蛋白质二级结构预测,是通过氨基酸序列,预测蛋白质二级结构的过程。氨基酸序列具有不同的长度,不同的氨基酸排列顺序。实验分析表明这种差异能够形成不同的蛋白质结构。研究蛋白质的结构意义重大,不但有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,认识蛋白质与蛋白质之间的相互作用,而且对生物学、医学和药学都有非常重要的作用[8]。

2.4.2、蛋白质的三级结构分析

方法:

将分析的结果向蛋白质立体结构数据库PDB ( Protein Data Bank)提交该蛋白质序列,利用RasMol软件显示该蛋白的三维分子结构

蛋白质三级结构(protein tertiary structure): 蛋白质分子处于它的天然折叠状态的三维构象。三级结构是在二级结构的基础上进一步盘绕,折叠形成的。三级结构主要是靠氨基酸侧链之间的疏水相互作用,氢键,和盐键(离子键)维持的。此外共价二硫键在稳定某些蛋白质的构象方面也起着重要作用。

通过研究蛋白质的三级结构,可以让我们更直观的通过其结构了解其功能性,从而为蛋白质功能的确定提供有力的依据[9]。

2.5、 基因编码蛋白质的功能分析

2.5.1、信号肽预测的方法

方法:

利用丹麦科技大学(DTU)的CBS服务器蛋白质序列的信号肽(signal peptide)预测,进入Prediction Serves 页面。

网址如下: 参数选择:

Eukaryotes;Both;GIF (inline);Standard

信号肽,常指新合成多肽链中用于指导蛋白质的跨膜转移(定位)的N-末端的氨基酸序列(有时不一定在N端)。

信号肽位于的N端。一般由15~30个氨基酸组成。包括三个区:一个带正电的N末端,称为碱性氨基末端:一个中间疏水序列.以中性氨基酸为主,能够形成一段d螺旋结构,它是信号肽的主要;一个较长的带的C末端,含小分子氨基酸,是信号序列切割位点.也称加工区。

信号肽的作用,可使正在翻译的核糖体附着到RER膜上,还可以在信号肽指引下蛋白质在细胞内[10]。

通过信号肽的预测,可以让我们知道蛋白质是如何跨膜转移的。 2.5.2、磷酸化位点分析的方法

方法:

磷酸化和去磷酸化是细胞内信号传导的重要方式,利用丹麦科技大学(DTU)的CBS服务器上的NetPhos2.0 Server程序做磷酸化位点分析。NetPhos2.0 Server程序是基于神经网络算法,对蛋白序列中的Ser、Thr和Tys三种氨基酸残基可能成为的磷酸化位点作出预测。

网址如下:

蛋白质磷酸化是最常见、最重要的一种蛋白质翻译后修饰方式,它参与和调控生物体内的许多生命活动.通过蛋白质的磷酸化与去磷酸化,调控信号转导、基因表达、细胞周期等诸多细胞过程.随着蛋白质组学技术的发展和应用,蛋白质磷酸化的研究越来越受到广泛的重视[11]。

2.5.3、亚细胞定位的方法

方法:

通过WoLF PSORT工具基于其氨基酸序列预测蛋白质亚细胞定位点 网址如下: 参数选择:

Fungi;From Text Area

亚细胞定位是指某种蛋白或表达产物在细胞内的具体存在部位。例如在核内、胞质内或者细胞膜上存在。GFP是绿色荧光蛋白,在扫描共聚集显微镜的激光照射下回发出绿色荧光,从而可以精确地定位蛋白质的位置[12-14]。 2.5.4、二硫键分析的方法

运用scratch protein Predictor 对蛋白质的二硫键做出分析。 网址如下:

线粒体基因全分析及进化树的构建毕业论文

1、前言(Introduction)英国《自然》杂志网络版2006年5月18日报道,科学家已对含有2.23亿个碱基对,占人类基因组中碱基对总量的8%左右的人类第一号染色体完成测序,宣告持续16年的人类基因组计划全部完成。作为人类自然科学史上重要的里程碑,“人类基因组”的研究已从“结构基因组”阶段进入“功能基因组”阶段。在人类基因组计划后相继推出的水稻基因组计划、马铃薯基因组计
推荐度:
点击下载文档文档为doc格式
3v8vo1xxgu8mpoj7ocb09o8y29wt5t00z3e
领取福利

微信扫码领取福利

微信扫码分享