2018 年谷歌旗下的 DeepMind 团队开始尝试使用人工智能技术预测蛋白质结构。在前人研究的基础上他们开发了第 1 代系统称为 AlphaFold1。这一系统通过分析蛋白质的氨基酸序列并结合已有的生物学知识对蛋白质结构进行预测。尽管AlphaFold1 取得了一定成果但其预测精度尚未达到科学研究中的实用标准。然而这一尝试为后续研究奠定了重要基础。2020 年AlphaFold2 的问世标志着蛋白质结构预测领域的重大突破。AlphaFold2 的预测误差达到了 1.6 埃约为一个原子的直径其精度已经接近实验测定水平。图展示了AlphaFold2 预测的几种蛋白质结构其中绿色是真实的蛋白质结构蓝色为 AlphaFold2 预测的结果。图:AlphaFold2 预测的几种蛋白质结构。图片来源Jumper et al., 2021整体上AlphaFold2 采用了一种端到端的神经网络模型如图39.11所示其输入为蛋白质的氨基酸序列输出则是该序列对应的空间结构。在预测过程中系统综合了两个额外的信息来源1基因数据库用于查找输入序列的同源序列发现氨基酸之间的共变关系从而提供结构预测的约束条件。2蛋白质结构数据库提供相蛋白质的已知结构为预测结果提供参考。图:AlphaFold2 的模型框架。图片来源Jumper et al., 2021.AlphaFold2 的成功不仅验证了安芬森理论还为科学家们提供了一种强大的计算工具使他们能够在短时间内解析大量蛋白质的结构。这一突破为众多领域打开了全新的发展空间。例如精确预测病毒蛋白质结构可以加速疫苗研发而深入解析癌细胞的蛋白质结构则有助于开发更精准的个性化治疗方案。据 DeepMind 官方报道截至 2022 年来自全球 190 多个国家的 50 多万名科学家已将AlphaFold 作为日常研究工具广泛应用于药物设计、疾病机理研究甚至探索生命活动的基本规律。