好文档 - 专业文书写作范文服务资料分享网站

深兰科技-AI再胜人类!初探AlphaFold预测蛋白质结构的性能达到何种段位?(上篇)

天下 分享 时间: 加入收藏 我要投稿 点赞

深兰科技|AI再胜人类!初探AlphaFold预测蛋白质结构的性能达到

何种段位?(上篇)

2024年12月,谷歌(Google)旗下DeepMind团队的新成果——人工智能系统AlphaFold,首次参加Critical Assessment of Protein Structure Prediction(CASP,全球蛋白质结构预测竞赛)就获得了冠军。CASP相当于蛋白质结构预测界的世界杯,已经举办到了第13届。该赛事从1994年开始,每两年一届。这里笔者拟从蛋白质结构特点出发, 探讨 “第一版AlphaFold”可能达到的“段位”。 全文将分上下篇 两次推送

今天首先围绕蛋白质的结构特点进行阐述。 蛋白质的结构特点

地球分子生物学和分子遗传学的常识告诉我们 :遗传信息被储存在DNA分子里,特定蛋白质或者多肽链的遗传信息通过转录形成信使(mRNA),然后在核糖核蛋白体内按照mRNA携带的遗传信息被表达成为蛋白质。刚被合成出来的蛋白质只有一级结构。以后在伴侣蛋白质(Chaperone Protein)的帮助下(在本文中这一点非常重要)逐渐形成蛋白质的高级结构(Protein Higher Structure), 包括蛋白质的二级、三级和四级结构。 蛋白质的一级结构(Primary Structure)。

蛋白质或者多肽链由氨基酸构成,这些氨基酸 “一字排开” 就形成了蛋白质的一级结构。常见的氨基酸只有20种,缩写的符号有单字母方式和三字母方式两种,从数学的角度也可以把他们理解成一串三字母或者单字母的字符串。

△一段三字母缩写方式显示的简单的蛋白质一级结构

20种氨基酸的结构符合一个通式,如下图所示,中间的碳原子称为Cα碳原子,表示它处在α位;左边连了一个氨基-NH2,称为N端;右边连了一个羧基-COOH,称为C端。20种不同氨基酸的差别就在于Cα上连接的侧链基团R。20种氨基酸连接的方式为脱水缩合,即一个氨基酸的羧基-COOH和另一个氨基酸的氨基-NH2反应,丢掉一个H2O,形成一个肽键-CO-NH-。丢掉了羧基和氨基的氨基酸被称为氨基酸残基。

◆蛋白质二级结构

⊙蛋白质二级结构(Protein Secondary Structure)

是指在一级结构的基础上,肽链进行盘旋、折叠等变换,形成一种局部的三维结构,这种局部的三维结构通常由氢键支撑。细分的话,蛋白质的二级结构总共有8种,包括转角、无规则卷曲等。有些文献会把8种结构粗分为α螺旋(α-Helix)、β折叠(β-Sheet,或者β-Strand )、转角(Turn)和无规则卷曲(Random Coil)四种结构(请见下图和三级结构中的图示)。

当然,具体的细节很多,比如:形成β折叠的两股链都是从N到C(或从C到N),则称为平行排列,否则是反平行排列。每股β折叠都有一个大箭头表示其方向。

☉蛋白质的超二级结构(Proteinsuper-Secondary Structure)

是指二级结构里有特定结构和功能的区域,根据功能和结构的完整性,又分为结构域(Domain)和基序(Motif)。

△上图显示结构域

△上图显示基序

◆蛋白质的三级结构(Protein Tertiary Structure)

简单理解,三级结构就是把多个二级结构拼接到一起,折叠成一个完整的蛋白质三维结构,一般是由一条多肽链构成的。如下图所示。维持蛋白质三级结构的力比较多样,除了氢键之外,还有二硫键、金属键等。

深兰科技-AI再胜人类!初探AlphaFold预测蛋白质结构的性能达到何种段位?(上篇)

深兰科技|AI再胜人类!初探AlphaFold预测蛋白质结构的性能达到何种段位?(上篇)2024年12月,谷歌(Google)旗下DeepMind团队的新成果——人工智能系统AlphaFold,首次参加CriticalAssessmentofProteinStructurePrediction(CASP,全球蛋白质结构预测竞赛)
推荐度:
点击下载文档文档为doc格式
0lin62nbhr3pebe0io3703gjy5zcvb00lr6
领取福利

微信扫码领取福利

微信扫码分享