记者6月10日从中国科学技术大学获悉,该校教授江俊、罗毅与美国加州大学尔湾分校科学家合作,利用人工智能机器学习中的神经网络技术,成功预测了蛋白质肽键紫外光谱,模拟了肽键结构与性质之间的构效关系,并大大减少了计算量。相关成果发表在最新一期著名期刊《美国科学院院报》上。人工智能与量子化学理论计算的结合,为预测蛋白质光学特性提供了一种高效工具。
蛋白质是生命的基石。蛋白质的光谱响应信号,尤其是紫外光谱,可以称之为蛋白质骨架的“指纹”。这个“光学指纹”,经过理论模拟的解读,可以揭示出精确的蛋白质结构,为生命科学和医学诊断提供极其重要的信息。然而,蛋白质结构极其复杂,需要做大量高精度的量子化学理论计算。由于计算量太大,即使是最厉害的超级计算机轻易也“吃不消”,这也限制了光谱的准确分析和蛋白质结构的发现。
江俊课题组近些年致力于发展机器学习技术在量子化学领域的应用。在本工作中,研究人员首先在300K温度下通过分子动力学模拟以及量子化学计算,得到5万组不同构型的肽键模型分子。通过机器学习算法筛选出键长、键角、二面角、电荷信息作为描述符,通过神经网络来构建肽键基态结构与其激发态性质之间的构效关系。基于训练好的机器学习模型,预测出肽键的基态偶极矩及激发态性质,最后成功预测出肽键的紫外吸收光谱。
这是人工智能技术首次用于理论计算预测蛋白质光谱研究,确立了机器学习模拟蛋白质肽键骨架紫外吸收光谱的可行性和优势,蛋白质的“光学指纹”解读将会变得更加轻易有效。