人工智能彻底改变了我们研究蛋白质的方式

根据蛋白质的氨基酸序列预测其形状是生物学上最大的难题之一,被称为蛋白质折叠问题。蛋白质的三维或球状形状对其细胞功能至关重要,这意味着可视化蛋白质结构对生物科学的许多领域都至关重要。然而,通过实验室方法解决蛋白质构象存在着重大挑战。大量不同的氨基酸组合,从x射线结晶学的健康风险,快速降解的蛋白质样品导致缓慢而常常令人沮丧的进展生物化学家在过去五十年(1)下一代的方法在蛋白质结构说明取决于先进的计算能力和人工智能。

领跑者:AlphaFoldDeepMind

今年早些时候,DeepMind的一个团队发布了他们最新的人工智能蛋白质结构预测系统AlphaFold。该系统是由DeepMind开发的,作为蛋白质结构预测关键评估(CASP)竞赛的参赛项目,并在2018年CASP13(2)和2020年CASP14中获得一等奖。AlphaFold使用了3种深度学习机制,1)预测氨基酸对之间的距离,2)估计一个潜在结构的准确性,3)生成三维蛋白质结构(3)。在人工智能确定蛋白质构型方面取得了重大进展(2)。AlphaFold神经网络被训练来预测未知结构的氨基酸之间的距离和键角。然后,所有的测量预测都被结合起来,给最终的提议结构一个总体的准确性评分。

未来的创新建立在传统方法的基础上

生物化学家在20世纪和21世纪进行的这项渐进但基础的工作产生了充满已知蛋白质序列和结构的数据库。为了预测一个未知的结构、AlphaFold等深度学习方法需要大量的资源已知的的数据库中的数据蛋白质数据银行.AlphaFold算法得分最准确的构象与已公布的蛋白质结构进行了比较(3)。AlphaFold的成功,加上新数据的日益可用性,扩大了蛋白质工程的可能性,从突破性的新药到富有想象力的生化武器。

在我们由三部分组成的系列文章的下一部分中,我们将探索AlphaFold的一些潜在应用,并讨论它们对医学、经济和人权的影响。

参考文献

  1. Jonathan C. Brooks-Bartlett & Elspeth F. Garman(2015)诺贝尔科学:晶体学百年,跨学科科学评论,40:3,244-264,https://doi.org/10.1179 / 0308018815 z.000000000116
  2. Senior, A., Jumper, J., Hassabis, D., & Kohli, P.(2020)。AlphaFold:利用人工智能进行科学发现。从检索https://deepmind.com/blog/article/AlphaFold-Using-AI-for-scientific-discovery
  3. Senior, AW, Evans, R, Jumper, J,等。第13届蛋白质结构预测关键评估(CASP13)中使用多深度神经网络的蛋白质结构预测。蛋白质.2019;87: 1141 - 1148。https://doi.org/10.1002/prot.25834