在坎昆举行的结构预测评估(CASP)国际竞赛上,该竞赛的组织者宣布,谷歌旗下DeepMind公司最新的人工智能程序AlphaFold在预测蛋白质(即生命的基本分子)的三维形状中打败了所有竞争对手。
人工智能网络图
“蛋白质折叠”是一种不可思议的的分子折叠形式,虽然科学界很少对其进行讨论,但它仍然是一个非常重要的问题。生物个体是由蛋白质构成的,蛋白质的形状决定了它的功能。弄清楚蛋白质是如何折叠的,就意味着研究人员可以开创科学和医学进步的新时代。
人体可以制造大约十亿种不同的蛋白质,它们每一种都包含氨基酸链,能够以20种不同的形态出现。蛋白质可以在每个氨基酸之间扭曲和弯曲,因此具有数百个氨基酸的蛋白质有可能呈现出数量惊人的不同结构:可能会围绕成一个四维立方体,或是呈现300个零种形态。
蛋白质采用的3D形式取决于它所含氨基酸的数量和类型,而它的形状决定了它在生物体内的作用。例如,心脏细胞点缀着折叠的蛋白质,使得血液中的任何肾上腺素都能粘住它们并使心率上升。同时,免疫系统中的抗体是折叠成特定形状的蛋白质,这些蛋白质可以阻挡入侵的病菌。几乎身体的每一个功能,从紧张肌肉和感应光到将食物转化为能量,都可以追溯到蛋白质的形状和运动。
一般情况下,蛋白质具有最节能的形状,但它们的缠结和错误折叠,会导致糖尿病,帕金森氏症和阿尔茨海默病等疾病。如果科学家能够从化学成分中预测出蛋白质的形状,他们就可以弄清楚其作用,以及它可能会造成的伤害,并设计出治愈方案或为其他领域给出解决办法,比如打破环境中的塑料污染。
DeepMind将AlphaFold引入了结构预测评估(CASP)竞赛,这项竞赛可以算得上是蛋白质折叠大赛界的奥运会,一年举行两次,吸引了来自世界各地的研究团体。竞争需要从氨基酸列表中预测蛋白质的结构,连续数月每隔几天这些氨基酸列表就被送到每个团队的手中,提交最准确预测的团队获胜。
在首轮比赛中,AlphaFold在98名参赛者中排名第一,其预测的43种蛋白质中有25种蛋白质的结构最准确,而同一类别中排名第二的队伍中有43种结构中只有3种预测的最为准确。
为了构建AlphaFold,DeepMind在数千种已知蛋白质上构建了一个神经网络,直到它可以预测单独使用氨基酸的3D结构。鉴于要研究的是新蛋白质,AlphaFold使用神经网络预测氨基酸对之间的距离,以及连接它们的化学键之间的角度。随后,AlphaFold调整草图结构以找到最节能的布置。AlphaFold花了两周时间来预测它的第一个蛋白质结构,但现在它只需要几个小时就能预测到结果。
雷丁大学研究员Liam McGuffin表示:“能够预测出蛋白质折叠形状,对解决许多21世纪的问题具有重大意义,它能够影响健康、生态、环境,并基本上能够解决任何涉及生命系统的问题。”