人工智能(AI)已经成为产业和社会变革的重要技术引擎,围绕“AI+生命科学”这一主题,我介绍一下生物世界正在发生的数字化和智能化的新变革,并分享清华大学智能产业研究院(AIR)在这方面的一些科研进展。
我们的使命是用AI的技术创新赋能产业升级、推动社会进步。要做这件事,最重要的还是要打造学术和产业创新的新引擎。
AIR成立不到两年时间,就在全球范围内吸引了一批拥有很深学术造诣、很丰富产业背景的AI领域领军人物,同时也建立了与产业的深度合作,例如与百度、亚信科技、小米等企业以及一些实验室开展深度合作。
“第四范式”促进转型
我们正在快速步入数字化3.0时代,基因测序、高通量生物试验、脑机接口等技术,让大脑数字化、身体器官数字化以及细胞数字化,这产生了海量的数据。各种组学数据加上新的AI算法和大的算力,正在形成一种新的智能科学计算范式,称之为“第四范式”,其正在加速生命科学和生物、医疗领域向着更快速、更精准、更安全、更经济、更普惠的方向发展。
从产业的角度来看,2015年之后,头部制药企业均加速了和AI技术公司合作研发的脚步。科技公司这些年的投资大幅度增加,涌现出一大批独角兽企业,中国的医疗行业也面临着从做仿制药到做创新药的转型,AI在转型过程中发挥了重要作用。
AIR建立起一支很强的智慧医疗科研团队并选择了两大主要研究方向:主动健康管理、数字疗法,以及大分子、小分子药物发现。用大量的AI算法和数据,打造双通道高效干湿闭环接口,实现湿实验的数字化。
在脑机接口的数字疗法方面,以杭州的BrainCo公司研发的脑机接口技术为例。在脑疾病研究中,脑电数据是一种模态,在不同疾病中有波动,从而可以得出疾病和脑电之间的关系。这个技术还可以将不同模态的信息结合在一起,利用AI算法进行关联分析,形成一种训练软件,应用到很多场合。
我们知道,妊娠期糖尿病发病率很高,通过健康管理能够更好地实现早期预防。AIR数字疗法聚焦心血管疾病早期预防和主动干预,通过获取大量数据,构建一个针对疾病的健康营养知识图谱。有了数据和各种各样的AI算法,就可以用个性化的健康推荐引擎,对健康和习惯进行监测、管理和预防。
AlphaFold2仅仅是开始
AlphaFold2是AI在生命科学应用中最成功的表现,其成功因素主要是两个方面:一个是任务的特殊性,也就是蛋白质结构预测;一个是模型本身的优越性。
首先,我们积累了大量数据。生命科学研究有很多数据都是“端到端”的。最近,AIR的兰艳艳教授团队研发的系统化蛋白质结构预测解决方案AIRFold就实现了信息的表达和抽取,融合序列及结构信息等。这里用了多项检索,也生成了一些核心技术。同时,我们还与清华医学院、华深智药合作,首次将AI算法用于抗体设计,特别是用于新冠病毒抗体的研发,这就用到网络、计算和实验的抗体设计的融合。其实可以用各种不同的算法,开发更有亲和力、更广谱的抗体,希望这些工作能很快进入临床。
AlphaFold2仅仅是一个开始,未来抗体、抗原的表位预测,肿瘤的精准疗法等方向,都会成为研究热点,并且在新的计算模式下取得更多进展。
AI+大分子治疗的黄金时代到来
我认为,AI+大分子治疗的黄金时代正在到来,这会产生一些新的科学挑战,也预示着会有一些新的方法。比如,干湿融合的闭环式的计算框架一方面可以通过高通量多轮的闭环验证和数据补充,变得更加智能;另一方面,通过主动学习、强化学习等方式,AI将主动规划实现干湿闭环验证,迭代加速生命科学发现与产业应用。可以预见,通过干湿闭环打通生命科学的研究和生物医疗产业,将会迎来新的科研和产业模式。
生物世界处于“数字化+自动化+智能科学计算”的新变革期,AI、数据驱动的“第四范式”辅助人类探索并解决生命健康问题,这将会成为一个重要的研究方向。
未来,需要学术界和产业界共同推动生命科学、生物医药、基因工程、个人健康等各个领域的协同发展,实现更快速、更精准、更安全、更经济、更普惠的创新模式。这里面还有很多挑战,比如说算法的透明性、可解释性,隐私安全和伦理。整体来讲,未来十年我们将会看到巨大的机会、新的科学发现、新的产业创新,我也希望更多人才和资源能够投入到这一领域。■
(作者系中国工程院院士、清华大学智能产业研究院院长,记者高雅丽根据其在世界数字经济论坛的发言整理)
《科学新闻》 (科学新闻2022年12月刊 封面)