2023年世界十大科技进展新闻 |
|
人工智能首次成功从零生成原始蛋白质 |
|
人工智能首次成功从零生成原始蛋白质 图片来源:IAN C. HAYDON
2023年1月26日,美国Salesforce Research、Profluent Bio等机构在《自然-生物技术》上发表了一项研究成果,该研究创建了一个能够从头开始生成人造酶的人工智能(AI)系统。在实验室测试中,尽管人工生成的氨基酸序列与任何已知的天然蛋白质存在显著差异,但其中一些酶与自然界中发现的酶一样有效。
该实验表明,虽然自然语言处理是为读写语言文本开发的,但至少可以学习一些生物学的基本原理。Salesforce Research公司开发的名为ProGen的AI程序,能够使用下一代标记预测将氨基酸序列组装成人造蛋白质。
为了创建这个模型,科学家只需将2.8亿种不同蛋白质的氨基酸序列输入机器学习模型,并让它在几周内消化信息。然后,他们使用来自5个溶菌酶家族的5.6万个序列,以及有关这些蛋白质的上下文信息对模型进行微调。
该模型迅速生成了100万个序列。研究团队根据它们与天然蛋白质序列的相似程度,以及AI蛋白质的潜在氨基酸“语法”和“语义”的自然程度,选择了100个序列进行测试。
在第一批由Tierra生物科学公司体外筛选的100种蛋白质中,该团队制作了5种人工蛋白质用于细胞测试,并将其活性与鸡蛋清中发现的一种酶——鸡蛋清溶菌酶进行了比较。在人类的眼泪、唾液和牛奶中也发现了类似的溶菌酶,它们可以抵御细菌和真菌。其中,两种人工酶能够分解细菌的细胞壁,其活性与鸡蛋清溶菌酶相当。但它们的序列只有约18%相同,这两个序列与任何已知蛋白质的相似性分别为90%和70%。
AI甚至能够通过研究原始序列数据了解酶如何形成。X射线晶体学测量显示,人造蛋白质的原子结构看起来和它们应该有的样子一样,尽管这些序列是前所未有的。
科学家表示,这项新技术可能比获得诺贝尔奖的“蛋白质设计技术——定向进化”更为强大,它将加速新蛋白质的开发,为已有50年历史的蛋白质工程领域注入活力。这些新蛋白质几乎可以用于从疾病治疗到降解塑料的任何领域。■
《科学新闻》 (科学新闻2024年2月刊 封面)