小麦FT基因编码蛋白结构及功能的生物信息学分析
焦义然1,2,陈文烨1,2,杨 帆2,刘永伟2,董福双2,杜进民1*,周 硕2* 【摘 要】利用生物信息方法分析和预测小麦FT基因编码蛋白的理化性质、结构域、信号肽、跨膜区、亚细胞定位和三级结构,对不同植物FT基因编码蛋白的功能位点、密码子使用偏性和系统发育进行分析。结构表明,小麦FT基因编码177个氨基酸,编码产物为一种亲水性的脂溶性蛋白质,二级结构主要是由β折叠为主,其次分别是α螺旋和β转角,不存在信号肽和跨膜区,主要定位于线粒体中,同源建模的相似度为89.57%,除满天星外,其余植物均具有PEBP蛋白,小麦FT基因对密码子的使用具有较强的偏好性,且不同植物FT基因密码子偏性间的相似关系与系统发育分析得出的亲缘关系具有一致性。说明FT基因在不同植物长期进化过程中具有较强的保守性。 【期刊名称】江西农业学报 【年(卷),期】2018(030)010 【总页数】6
【关键词】FT基因;小麦;生物信息学;蛋白质结构预测;PEBP蛋白 【文献来源】
https://www.zhangqiaokeyan.com/academic-journal-cn_acta-agriculturae-
jiangxi_thesis/0201270713459.html
基金项目:国家重点研发计划“七大作物育种”重点专项(2016YFD0101802);河北省现代农业创新工程项目(494-0402—YBN-RDC4)。
植物由营养生长到生殖生长离不开一个重要的过程,即开花相关基因的表达[1]。对于植物的成花诱导途径主要有6种,分别是光周期(Photoperiod)、春化(Vernalization)、赤霉素(Gibberellin)、 自主调节(Self-regulation)、年龄依
赖(Age dependence)和温敏(Temperature sensitive)[2-3]。许多研究表明,开花是由FT(Flowering Locus T)基因及其同源物来调节的[4-6]。在模式植物拟南芥FT基因研究中,发现其编码产物能长距离转运成花激素,对花的形成具有决定作用[7-8]。小叶杨具有两个FT同源基因,分别是FT1和FT2,40 d内转基因杨树具有开花能力[9]。山葡萄FT基因的表达高峰出现于花序刚开始展露期,在花的前期形成过程中可能具有调控作用[10]。番茄和烟草FT基因的过表达能导致开花期提前,杨树FT同源基因转化到模式植物拟南芥中,造成拟南芥对光周期不敏感,以至开花期的提前[11-13]。FT基因编码蛋白的结构对其功能具有决定作用,且大多数氨基酸残基的突变对开花不存在显著影响,即为FT基因序列的多样性[14]。在长期进化过程中,不同植物FT同源基因为适应各自的生态环境具有不同的功能[15-16]。在植物界中,同一个基因的多功能现象是普遍存在的,且进化形成的复制加倍也能造成植物基因组中基因多拷贝的结果[17-18]。某种物种基因的核苷酸或蛋白质序列的结构功能可以通过生物信息学分析得出,本研究利用生物信息方法分析小麦FT基因编码蛋白的理化性质、结构域、信号肽、跨膜区、亚细胞定位,并通过同源建模的方法预测小麦FT基因编码蛋白的三级结构,并对不同植物FT基因编码蛋白的功能位点、密码子使用偏性和系统发育进行分析。对小麦FT蛋白的结构和功能研究奠定基础,并为研究不同植物FT基因在进化过程中的保守性提供理论依据。
1 材料与方法
如表1所示,不同植物的序列来源于NCBI的核苷酸和蛋白质数据库,通过登录号可查询不同植物FT基因的序列信息。利用ProtParam在线软件(http://web.expasy.org/protparam/)对21种植物FT基因理化性质进行分析,
同时通过Protscale在线软件(http://web.expasy.org/protscale/)分析小麦FT基因编码蛋白亲水性,通过CFSSP(http://www.biogem.org/tool/chou-fasman/)、SignalP 4.1 Server(http://www.cbs.dtu.dk/services/SignalP/)、TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)Prosite(http://prosite.expasy.org/)
和
、TargetP
1.1(http://www.cbs.dtu.dk/services/TargetP/)等在线软件对小麦FT基因编码蛋白的二级结构、信号肽、跨膜结构域、模块和亚细胞定位进行分析,通过SSWISS MODEL(http://swissmodel.expasy.org/)中的同源建模预测小麦FT基因编码蛋白的三级结构,通过CodonW和MEGA软件中的最大似然法分析21种不同植物FT基因的密码子偏性和系统发育。
2 结果与分析
2.1 小麦FT基因编码蛋白理化性质的分析
小麦FT基因共编码177个氨基酸,如图1所示,缬氨酸(V)、精氨酸(R)和甘氨酸(G)在FT基因编码氨基酸中所占比例最高,分别是11.3%、9.6%和9.6%。等电点为7.73,分子量为19849.55,含有17个带负电荷氨基酸残基数(Asp + Glu),18个带正电荷氨基酸残基数(Arg + Lys),分子式为C876H1357N253O256S10,总原子数为2752。当全部Cys形成为胱氨酸,其消光系数为1.086,不能形成胱氨酸的消光系数为1.080。其余20种植物FT基因编码蛋白的不稳定指数、脂肪族氨基酸指数和亲水性总平均值如表1所示,小麦的脂肪族氨基酸指数最低,为70.9,拟南芥为88.97,位居最高;不稳定指数最低的是番茄,其次是小麦,最高的是大蒜,表明小麦和番茄相比其他植物相对较为稳定;本研究中所选取的多种植物的亲水性总平均值均为负值,
小麦FT基因编码蛋白结构及功能的生物信息学分析
![](/skin/haowen/images/icon_star.png)
![](/skin/haowen/images/icon_star.png)
![](/skin/haowen/images/icon_star.png)
![](/skin/haowen/images/icon_star.png)