小鲵科动物Cytb基因密码子偏好性分析
姜 艳, 张全星, 管德龙, 许升全*
【摘 要】利用Mobyle在线工具的 CUSP 程序以及CodonW、Cluster3.0软件对NCBI数据库中16种小鲵科动物的细胞色素b(Cytochrome b,Cytb)基因密码子偏好性进行了分析,并探讨密码子偏好性对系统发育分析的影响。结果表明:16种小鲵科动物Cytb基因的有效密码子数范围为34.45~47.18,平均值为41.01,该基因有密码子使用偏好。该基因在组成上偏好使用以A或T碱基结尾的密码子。通过计算各物种每个密码子的同义密码子相对使用度值并做密码子和物种的分层聚类发现,在不同属间密码子使用的模式明显不同。基于Cytb基因密码子偏好性的物种聚类结果与基于Cytb基因序列构建的最大似然法和贝叶斯系统发育树结果不完全一致。【期刊名称】陕西师范大学学报(自然科学版)【年(卷),期】2016(044)004【总页数】6
【关键词】小鲵科; 细胞色素b基因; 密码子偏好性; 系统发育
密码子是指DNA或RNA的碱基序列与编码蛋白质的氨基酸序列间的对应关系[1]。密码子偏好性是指在蛋白质合成过程中,翻译为同一氨基酸的各同义密码子使用频率不相同,在某一物种或基因中存在倾向于使用某一种或几种特定密码子的现象[2]。密码子偏好性在生物界中广泛存在[3],不同的偏好模式可能由多种因素诱导,如基因的碱基组成[4]、基因长度[5]、tRNA丰度[6]、mRNA二级结构[7]、蛋白质的亲疏水性[8]以及密码子-反密码子间结合强度[9]等。这些因素在不同物种中具有一定的特异性,因此对密码子偏好的研究有助于揭示物种间或某一物种基因家族间的基因进化规律[10]。
大多数动物的线粒体DNA包括37个基因(2个rRNA基因、22个tRNA基因、13个蛋白质基因)和1个包含复制起点的控制区[11-12]。线粒体DNA具有拷贝数多、分子量小、容易扩增、高度保守、母系遗传、进化速度快和非组织特异性等优点[13-15],被广泛应用于动物系统进化及遗传多样性研究中。细胞色素b(Cytochrome b, Cytb)基因是线粒体13个蛋白编码基因中结构和功能了解最清楚的基因之一[16],其进化速度适中,是系统发育和遗传学研究最常用的分子标记之一[17]。对Cytb基因的密码子偏好性进行研究将有助于揭示密码子偏好在系统分类研究中的有效性。
小鲵科(Hynobiidae)是环青藏高原分布于亚洲东部地区的珍稀特有有尾两栖动物。目前,小鲵科已报道的分子系统学和分类学研究工作比较丰富,分类关系也较为清楚,但还未见对其密码子偏好性的研究[18-21]。因此,本文选取16种小鲵科动物的线粒体Cytb基因为研究对象,通过计算各个物种之间碱基组成以及密码子的偏好性特点,初步分析小鲵科Cytb基因密码子的使用模式及进化规律,以期对小鲵科物种进化和分类研究提供一些参考。
1 材料与方法
1.1 Cytb基因序列的来源
本研究使用的Cytb基因全长区编码序列(coding DNA sequence,CDS)均下载于GenBank,不同物种的Cytb基因在NCBI数据库(http://www.ncbi.nlm.nih.gov)中的登录号见表1。1.2 分析方法
1.2.1 碱基组成及偏好性分析 (1)有效密码子数(effective number of codons,ENC)是指一个基因的密码子使用频率与同义密码子平均使用频率偏差的量化值,反映基因密码子使用的偏爱程度[22],取值范围为20(每个氨基酸只使用一种密码子)~61(全部种类的密码子被均衡使用),其值越小,表明该基因的密码子使用偏好性越强[23]。本研究应用CodonW软件计算各物种Cytb基因ENC值。(2)全长基因GC含量及密码子三个位置的GC含量(GC1、GC2、GC3),利用Mobyle在线工具中的create a codon usage table(CUSP)计算获得。(3)同义密码子第 3 位上的各个碱基含量(A3s、C3s、G3s、T3s),使用CodonW软件进行计算。(4)同义密码子相对使用度(relative synonymous codon usage,RSCU)定义为某一同义密码子使用次数的观察值为分子,以该密码子出现次数的期望值为分母。如果密码子的使用无偏好性,则RSCU值为1;如果该密码子使用频繁,则RSCU值大于1[24]。用CodonW软件计算16种小鲵科动物Cytb基因的RSCU值。
1.2.2 基于密码子偏好性的16种小鲵科物种聚类分析 将16种小鲵Cytb基因序列对应的各密码子的RSCU值进行统计后转换为*.txt格式,导入Cluster 3.0软件中。对数据进行标准化后,对密码子(横轴)及物种(纵轴)同时进行聚类,应用斯皮尔曼等级聚类方法(Spearman rank correlation)进行平均连接(average linkage),最终输出结果为*.cdt格式。将cdt文件导入JAVATreeView软件[24]进行查看并编辑,灰度值由黑到白代表其值的大小,之后调整横纵轴由隐藏为显示状态,调整字体后,输出为热谱图(heat map)。
1.2.3 基于蛋白质编码序列构建系统发育树 将16种小鲵Cytb基因的蛋白质编码序列导入mega 6.0中进行比对分析。比对后的数据输出为数据包并导入Raxml及Mrbayes中,采用最大似然法和贝叶斯法构建系统发育树。
2 结果与分析
2.1 有效密码子数及碱基组成分析
16种动物Cytb基因 ENC值范围为34.45~47.18,平均值为41.01,表明它们的Cytb基因在密码子使用上具有偏好性,但为一般偏好性基因。使用Mobyle在线工具分析这16种动物Cytb基因的GC及密码子各个位置的GC含量,结果显示(图1):16种小鲵科动物Cytb基因的GC含量小于0.5,低于AT含量;密码子3个位置的GC含量为不均衡分布,且都呈现出GC1>GC2>GC3这一规律,表明密码子第3位的GC含量小于第1、第2位。进一步分析同义密码子第3位4种碱基的含量(A3s、C3s、G3s、 T3s),如图2可知,A3s含量最高,G3s含量最低。这16种小鲵科动物Cytb基因在编码时可能都偏好
使用 A结尾的密码子,避免使用G结尾的密码子。图1 小鲵科动物Cytb基因密码子不同位置GC碱基含量
Fig.1 GC contents at different codon positions in hynobiidae species′ Cytb genesGC、GC1、GC2、GC3分别代表序列全长、密码子各位点的GC碱基含量。2.2 基于Cytb基因密码子偏好性的物种及密码子聚类分析及热谱图
为了探究各物种Cytb基因密码子使用偏好性的差异及规律,采用Cluster 3.0软件对物种和密码子分别进行分层聚类(图3)。
横轴将所有密码子依据RSCU值的大小聚为两大分支:高频密码子多分布在左侧,低频密码子则多分布在右侧。进一步对两个分支的密码子进行比较,发现:两个分支中大部分以A或T 结尾的密码子被聚为一类,多数以G或C结尾的密码子聚为一类,而且以A或T结尾的密码子色阶明显高于使用G或C结尾的密码子,说明小鲵科动物Cytb基因中以AT结尾的密码子出现频率更高,为基因偏爱使用的密码子。此外,有部分氨基酸表现出在物种间较大的密码子使用偏性差异,如天冬氨酸Asn,聚类结果显示其与其他所有的密码子关联均不密切,还有一些不常用的密码子其RSCU值较低,如TTG。纵轴的聚类结果反映了小鲵科16个物种中Cytb基因密码子偏好性模式的相似程度,结果将16种动物分成为两大类:第一大类共包含5个物种,均隶属于小鲵属,其分类关系为((((中国小鲵+挂榜山小鲵)+猫儿山小鲵)+安吉小鲵)+东北小鲵);第二大类包含其余的物种,其中山溪鲵属的3个物种被聚为一个分支,具体的分类关系为((商城肥鲵+爪鲵)+(((极北鲵+水城拟小鲵)+施氏巴鲵)+(黄斑拟小鲵+((((盐源山溪鲵+山溪鲵)+西藏山溪鲵)+新疆北鲵)+秦巴巴鲵))))。这些结果显示至少在同属物种间,其密码子偏好模式是相似的,具有一定的分类学意义。
图3 基于Cytb基因同义密码子相对使用度16种小鲵及密码子的分层聚类和热谱图
Fig.3 The heat map and Hierarchal cluster analysis of 16 species and codons based on RSCU values of different Cytb genes
行表示对应物种列代表对应密码子RSCU值,颜色从灰色到黑色,分别代表RSCU值的高低。2.3 基于Cytb基因蛋白质编码序列的系统发育关系分析
基于比对后的Cytb基因蛋白质编码基因列,以大鲵作为外群,利用最大似然法及贝叶斯法构建系统发育树(图4)。结果将16种动物分成三大类:第一大类的分类关系中,山溪鲵属虽然仍聚为一小支,但山溪鲵与西藏山溪鲵亲缘关系较近而与盐源山溪鲵关系较远,与密码子聚类存在不同,新疆北鲵与极北鲵的分类地位与密码子聚类较为接近,都位于山溪鲵属的外侧,与根部直接相连;其余物种如施氏巴鲵、秦巴巴鲵等也与聚类结果存在较大区别。第二大类为小鲵属的((((中国小鲵+挂榜山小鲵)+猫儿山小鲵)+安吉小鲵)+东北小鲵),该结果与基于Cytb基因密码子偏好性的聚类结果完全一致。
3 结论
本研究所选小鲵科16种动物Cytb基因有效密码子使用数的范围为34.45~47.18,密码子使用上具有偏好性;在碱基组成方面,AT含量大于GC含量,且同义密码子第3位AT含量也大于GC含量,说明小鲵科动物Cytb基因在编码时都偏好使用 A或T结尾的密码子。因此推测碱基组成可能是引起该基因密码子偏好性的原因之一。
基于Cytb基因的同义密码子相对使用度对物种和密码子的聚类结果显示在小鲵科不同物种中使用偏好性差异变化,表明线粒体Cytb基因密码子使用模式在进化过程中具有保守性。这一现象符合Grantham[25]提出的基因组假说(genome hypothesis),即密码子偏好性具有物种特异性,同一物种内或系统发育关系相近的物种间一般表现出相似的密码子使用模式。图4 基于Cytb基因编码序列的系统发育树
Fig.4 A Phylogenetic tree of CDS of different Cytb genes
基于Cytb基因密码子偏好性的聚类结果与基于Cytb基因CDS构建的小鲵科系统发育树不完全一致,这种聚类分析和系统发育关系不一致的现象在冯慧颖等[26]、刘汉梅等[27]的研究中也出现过。其原因可能是单基因在进化上存在较大的突变,导致其密码子使用偏好性发生较大变化,因而表现出与真实的分类地位不同;另一种可能的原因是二者分析的对象和采用的方法不同,前者是针对各物种Cytb基因的密码子,采用分层聚类中的平均联接法进行聚类,后者是针对单个碱基,应用最大似然法和贝叶斯法构建发育树。我们也不能排除是其他原因影响了密码子偏好性参数的聚类结果。但密码子偏好性作为生物遗传信息改变的基础,其在系统发育关系构建中的作用不应该被忽视。参考文献:
[1] 刘庆坡,薛庆中. 遗传密码子及其应用[J]. 中国生物化学与分子生物学报, 2006, 22(11): 851-855.[2] 朱孝轩,朱英杰,宋经元,等. 基于全基因组和转录组分析的赤芝密码子使用偏好性比较研究[J]. 药学学报, 2014, 49(9): 1340-1345.
[3] CAMPOS J L, ZENG K, PARKER D J, et al. Codon usage bias and effective population sizes on the X chromosome versus the autosomes in Drosophila melanogaster[J]. Molecular Biology and Evolution, 2013, 30(4): 811-823.
[4] CARLINI D B, CHEN Y, STEPHAN W. The relationship between third-codon position nucleotide content, codon bias, mRNA secondary structure and gene expression in the drosophilid alcohol dehydrogenase genes Adh and Adhr [J]. Genetics, 2001, 159(2): 623-633.
[5] 孙铮,马亮,张宪省,等. Wolbachia pipientis wMel基因组水平上的密码子[J]. 中国科学 C 辑,2009,39(10): 948-953.
[6] OLEJNICZAK M, UHLENBECK O C. tRNA residues that have coevolved with their anticodon to ensure uniform and accurate codon recognition[J]. Biochimie, 2006, 88(8): 943-950.
[7] GU W, ZHOU T, MA J, et al. The relationship between synonymous codon usage and protein structure in Escherichia coli and Homo sapiens[J]. Biosystems, 2004, 73(2): 89-97.[8] RODRIGUEZ-TRELLES F, TARRIO R, AYALA F J. Switch in codon bias and increased rates of amino acid substitution in the Drosophila saltans species group[J]. Genetics, 1999, 153(1): 339-350.
[9] 石秀丽,黄京飞. 人类基因中同义密码子的偏好与密码子-反密码子间的结合强度密切相关吗?[J]. 科学通报, 2000, 45(23): 2520-2525.
[10] 吴宪明,吴松锋,任大明,等. 密码子偏性的分析方法及相关研究进展[J]. 遗传, 2007, 29(4): 420-426.
[11] CLARY D. The mitochondrial DNA molecule of Drosophila yakuba: nucleotide sequence, gene organization, and genetic code[J]. Journal of Molecular Evolution, 1985, 22(3):252-271.
[12] FAURON C M R, WOLSTENHOLME D R. Intraspecific diversity of nucleotide sequences within the adenine+ thymine-rich region of mitochondrial DNA molecules of Drosophila mauritiana, Drosophila melanogaster and Drosophila simulans[J]. Nucleic Acids Research, 1980, 8(22): 5391-5410.
[13] GISSI C, IANNELLI F, PESOLE G. Evolution of the mitochondrial genome of Metazoa as exemplified by comparison of congeneric species[J]. Heredity, 2008, 101(4): 301-320.[14] CUROLE J. Mitogenomics: digging deeper with complete mitochondrial genomes[J]. Trends in Ecology & Evolution, 1999, 14(10): 394-398.
[15] HARRISON R G. Animal mitochondrial DNA as a genetic marker in population and evolutionary biology [J]. Trends in Ecology & Evolution, 1989, 4(1): 6-11.
[16] GRAY M W. Origin and evolution of mitochondrial DNA [J]. Annual Review of Cell Biology, 1989, 5(1): 25-50.
[17] MEYER A. Shortcomings of the Cytochrome b gene as a molecular marker [J]. Trends in Ecology & Evolution, 1994, 9(8):278-280.
[18] BAEK H J, LEE M Y, LEE H, et al. Mitochondrial DNA data unveil highly divergent populations within the genus Hynobius(Caudata: Hynobiidae)in South Korea[J]. Molecules
and Cells, 2011, 31(2): 105-112.
[19] YOSHIKAWA N, MATSUI M, NISHIKAWA K. Genetic structure and cryptic diversity of Onychodactylus japonicus(Amphibia, Caudata, Hynobiidae) in northeastern Honshu, Japan, as revealed by allozymic analysis[J]. Zoological Science, 2012, 29(4): 229-237.
[20] MATSUI M, YOSHIKAWA N, TOMINAGA A, et al. Phylogenetic relationships of two Salamandrella species as revealed by mitochondrial DNA and allozyme variation (Amphibia: Caudata: Hynobiidae)[J]. Molecular Phylogenetics and Evolution, 2008, 48(1): 84-93.
[21] CHEN M Y, MAO R L, LIANG D, et al. A reinvestigation of phylogeny and divergence times of Hynobiidae(Amphibia, Caudata) based on 29 nuclear genes [J]. Molecular Phylogenetics & Evolution, 2015, 83: 1-6.
[22] WRIGHT F. The ‘effective number of codons’ used in a gene [J]. Gene, 1990, 87(1): 23-29.
[23] GUPTA S K, BHATTACHARYYA T K, GHOSH T C. Synonymous codon usage in
Lactococcuslactis: mutational bias versus translational selection[J]. Journal of Biomolecular Structure and Dynamics, 2004, 21(4): 527-535.
[24] SHARP P M, LI W H. An evolutionary perspective on synonymous codon usage in unicellular organisms [J]. Journal of Molecular Evolution, 1986, 24(1/2): 28-38.
[25] GRANTHAM R, GAUTIER C, GOUY M, et al. Codon catalog usage and the genome hypothesis [J]. Nucleic Acids Research, 1980, 8(1): 197-197.
[26] 冯慧颖,梁云,徐雷锋,等. 百合甘油-3-磷酸酰基转移酶(GPAT)基因密码子偏性分析及其表达受体选择[J]. 分子植物育种, 2014, 12(1): 127-137.
[27] 刘汉梅,赵耀,顾勇,等. 几种植物waxy基因的密码子用法特性分析[J]. 核农学报, 2010, 24(3): 476-481.
〔责任编辑 王 勇〕
doi:10.15983/j.cnki.jsnu.2016.04.345
基金项目:陕西省自然科学基础研究计划(2013JC2-04, 2013JC2-05);陕西省科学院重点基金(2012k-01)