蛋白质结构预测哪家强?两大国际团队同日在顶

来源:波谱学杂志 【在线投稿】 栏目:综合新闻 时间:2021年08月20日 01:25:06
作者:网站采编
关键词:
摘要:蛋白质是生命的物质基础,每个蛋白质的氨基酸链扭曲、折叠、缠绕成复杂的结构,想要破解这种结构通常需要花很长的时间,甚至难以完成。截至目前,约有10万个蛋白质的结构已经

蛋白质是生命的物质基础,每个蛋白质的氨基酸链扭曲、折叠、缠绕成复杂的结构,想要破解这种结构通常需要花很长的时间,甚至难以完成。截至目前,约有10万个蛋白质的结构已经用实验方法得到了解析,但这在已经测序的数10亿计的蛋白质中只占了很小一部分。

但“看清”蛋白的结构和人类的很多疾病机理、药物研发等等息息相关。在蛋白质结构解析的几十年历史中,X射线晶体学、核磁共振波谱学(NMR)、冷冻电镜(Cryo-SEM)技术纷纷发挥了巨大的贡献,但这些技术在科学界看来,都有着劳心劳力又价格高昂的缺点。

如何简单地通过蛋白质的氨基酸序列来预测其形状?如何能解答这一问题,了解生命运作方式的将打开截然不同的一扇窗。这种设想提出的50多年后,谷歌旗下人工智能公司DeepMind在去年12月的国际蛋白质结构预测竞赛CASP上投下重磅,他们开发的基于神经网络的新模型AlphaFold2击败了其他选手,在预测准确性方面达到接近人类实验结果,让整个结构生物学界震惊。

北京时间7月15日,DeepMind团队在顶级学术期刊《自然》(Nature)以“加快评审文章”(Accelerated Article Preview)形式在线发表了一篇题为“Highly accurate protein structure prediction with AlphaFold”的论文,全面详述了半年前造成轰动的这一模型,并首次对外分享开源代码。该论文于今年5月11日提交,7月12日被接收。

DeepMind团队向澎湃新闻()记者提供了一份声明,公司创始人兼首席执行官Demis Hassabis在声明中表示,去年在CASP14大会上我们揭晓了一个可以将蛋白质3D结构预测精确到原子水平的全新AlphaFold系统,此后我们承诺会分享我们的方法,并为科学共同体提供广泛、免费的获取途径。

“今天我们迈出了承诺的第一步,在《自然》期刊上分享AlphaFold的开源代码,并发表了系统的完整方法论,详尽细致说明AlphaFold是如何做到精确预测蛋白质3D结构的。作为一家致力于推动科学进步的公司,我们期待看到我们的方法将为科学界启发出什么其他新的研究方法,也期待很快能和大家分享更多我们的新进展。”Hassabis表示。

值得一提的是,就在同一天,另一顶级期刊《科学》(Science)也在线发表了另一预测蛋白质结构的研究文章,题为“Accurate prediction of protein structures and interactions using a three-track neural network”。

来自华盛顿大学、哈佛大学、德克萨斯大学西南医学中心等团队的研究人员开发了新的深度学习工具RoseTTAFold,其拥有媲美AlphaFold2的蛋白质结构预测超高准确度,而且更快、所需计算机处理能力更低。同样,研究团队也对外分享了开源代码。该论文提交于6月7日,7月7日被接收。

清华大学生命科学学院院长、高精尖中心执行主任王宏伟对澎湃新闻()记者表示,“高质量结构预测的源代码开放对整个科学界尤其是结构生物学领域的促进作用必然是巨大的。”他评价道,对于DeepMind这样一家商业公司来说,“团队愿意向公众分享代码,是一个新型科研范式的突破,将整体上有利于人类更好地探索未知。”

预测蛋白质结构,接近实验室测量

50多年前,科学家们就设想用计算机预测蛋白质结构。近年来,共同演化、接触图预测、深度机器学习等技术的引入,一些实验室的算法精度有了很大程度的提高。

曾经开发出Alphago、战胜人类顶尖棋手的DeepMind团队是其中的佼佼者,其团队的强大和资源雄厚是一般实验室无法企及的。2020年12月1日,他们在生物领域展现出实力,在两年一度的权威蛋白质结构预测评估竞赛(CASP)中用AlphaFold2击败其他参赛团队。

CASP是由马里兰大学John Moult教授等人于1994年组织。竞赛使用的是最新解决且尚未在蛋白质数据库(PDB)中存放或公开披露的结构,结构生物学家们利用X射线晶体学、核磁共振波谱学、冷冻电镜的方法,把这些蛋白质的结构解析出来。做蛋白质结构预测的团队则利用计算机程序来预测它们的结构。最后由独立的科学家团队则把计算机预测的模型和实验室的结构对照,分析不同计算机算法的预测结果。这是一种“双盲”测试,长期以来一直是评价结构预测准确性的金标准。

去年的CASP14共有84个常规题目,其中有14题因为生物实验没给出确定结构等原因被取消或延缓,其他70个题目的单体和复合物蛋白质所含有的氨基酸个数从73到2180不等。

19个国家的215个小组参加了CASP14。DeepMind公司的AlphaFold2预测的大部分结构达到了空前的准确度,不仅与实验方法不相上下,还远超解析新蛋白质结构的其他方法。

文章来源:《波谱学杂志》 网址: http://www.bpxzz.cn/zonghexinwen/2021/0820/356.html



上一篇:研究发现如何诱导程序性细胞死亡,Ausbian胎牛血
下一篇:我国新型高效糖尿病治疗药物开发取得重要进展

波谱学杂志投稿 | 波谱学杂志编辑部| 波谱学杂志版面费 | 波谱学杂志论文发表 | 波谱学杂志最新目录
Copyright © 2021 《波谱学杂志》杂志社 版权所有
投稿电话: 投稿邮箱: