作者:Alan Dove / 文 张红安 / 译 来源: 发布时间:2021-9-4 8:16:46
当机器人睡觉时,他们会梦到算法吗?

   据主要新闻来源称,人工智能(AI)在当今世界随处可见,其本身越来越多地受到计算机算法的驱动。营销人员利用人工智能来定位广告,工程师利用它来预测设备故障,而人工智能驱动的社交媒体平台对从时尚到政治的方方面面都产生了巨大的影响。

   尽管所有类型的人工智能(也被称为机器学习)都需要编程让计算机从案例中学习并做出推断,但业内人士可以区分不同形式的人工智能。在更广泛的人工智能领域中,有一部分策略采用了人工神经网络。它们模仿生物大脑,程序元素像神经元一样相互连接。在神经网络上运行的机器学习算法通常被称为深度学习系统,以将它们与其他方法(例如统计相关性)区分开来。

   如今,科学家们部署了各种类型的人工智能来挖掘海量数据,这些数据的来源从高通量DNA和RNA测序到大量电子病历。这些努力的样本揭示了广泛的策略和应用,并强调了在研究中使用人工智能的潜力和挑战。

 

遗传学的新面孔

 

   一些将机器学习应用于科学问题的软件开发者最初是为社交媒体公司工作的。例如,现在支持Facebook自动照片标记功能的算法的创造者在过去几年里一直专注于一个略有不同的图像处理问题:从面部特征识别罕见的遗传疾病。

   “实际上,大约一半的遗传疾病都有非常独特的面部特征,”位于马萨诸塞州波士顿的表型应用公司FDNA的首席执行官Dekel Gelbman说。虽然大多数人可以识别唐氏综合症患者的独特特征,但经过专门训练的人类遗传学家也能从面部特征中找出数千种其他不太常见的情况。这种类型的诊断依赖于丰富的经验,但由于许多遗传疾病的罕见性,很难获得经验。“少数非常有经验的遗传学家(有时也称自己为畸形学家)能够非常快速地观察患者并说,‘我以前见过类似的事情,’”Gelbman说。

   Gelbman和他的同事们利用精心整理的照片集,训练了一种机器学习算法,根据诊断特征对人脸进行分组。该技术的当前迭代使用了深度学习系统,FDNA已经在同一个框架上为不同的用户构建了多个智能手机应用程序。医生可以将一款应用程序带进诊所,在那里他们可以用手机的摄像头给患者拍照,并立即从应用程序中获得诊断建议。论坛应用程序允许他们与专家讨论这些诊断,而图书馆应用程序则提供相关文献。其他应用程序允许医学教育者和研究人员访问相同的算法。

   虽然大多数个体遗传疾病很罕见,但它们的集体影响很大:估计有10%的儿童出生时就患有一种罕见的遗传疾病,严重到足以影响他们的生活质量。“平均而言,一名罕见病患者要等待7年半才能得到诊断,这……简直难以想象,”Gelbman坦言。他希望将畸形学家的工作自动化,以便加快诊断速度。

   然而,要做到这一点,FDNA必须克服两个相关的障碍:(1)医生不愿依赖他们不了解的技术;(2)政府监管机构对医疗诊断的严格标准。两者都在努力克服当前机器学习系统的不可渗透性。“真的很难去相信人工智能系统,(因为)即使是程序员也很难理解结果的逻辑,”Gelbman说道。开发人员对算法进行训练和测试,直到得到正确的答案,但这些答案背后的原因常常令人费解。

   为了解决这个问题,Gelbman主张提高算法训练和测试的透明度。他说:“在未来,组织将更加主动地提供数据来源以及用于管理和验证数据、验证并为审计提供基准的政策。”就其本身而言,美国食品和药物管理局(FDA)一直在钻研人工智能,Gelbman表示,过去一年他们对这项技术的理解有了显著提高。尽管如此,FDNA迄今仍将其应用程序排除在监管机构的管辖范围之外,因为它清楚地将其标记为提供建议和参考,而不是明确的诊断。

 

如果达尔文是计算机科学家

 

   需要更高透明度的不仅仅是医疗诊断工具。“机器学习中的很多方法都是黑箱方法,当你与真正想了解系统是如何工作的生物学家合作时,这就是一个问题,而不仅仅是得到正确的答案;对他们来说,问题变成了‘为什么这个模型会选择这种特定的解决方案?’”加州圣地亚哥人工智能咨询公司Natural Selection的首席执行官Gary Fogel表示。

   Fogel的公司使用一种至少在原则上应该对生物学家有吸引力的机器学习来构建人工智能系统:进化算法。在这种方法中,问题的候选解决方案被当作群体中的个体一样对待,适应度函数决定了它们的质量。该系统有选择地放大较高质量的解决方案,并抑制或消除低质量的解决方案,直到出现最佳解决方案。Natural Selection已经将这种方法应用于从分析基因组数据、筛选候选药物分子到优化工业流程的方方面面。然而,正如前面提到的,每个解决方案的内在逻辑可能就像一个复杂的有机体一样难以理解。

   该公司通过构建识别系统中显著特征的算法来弥补这一点。“(我们试图找到)哪些特征对疾病或结果很重要,并……尝试着把这些特征简化成一些有意义的东西,以便生物学家……理解该系统的生物学,”Fogel说。

   不过,对于某些研究应用程序来说,不透明的算法不是问题。当研究人员将人工智能作为一种工具来识别有前途的线索时,这一点尤其正确,然后他们会用实验室实验来检查这些线索。“如果你只是想了解基因组学,也许需要的不是一个打开的盒子,”Fogel说道,“如果它仍然准确地预测了microRNA基因的位置,你真的不关心为什么它能正确地预测,只要它正确就行。”

   尽管如此,即便是希望将人工智能仅仅作为实验室工具的研究人员,也需要谨慎选择他们的算法。“很多人是这个领域的新手,他们正在尽可能地使用开源工具,”Fogel说,“他们并不一定知道如何针对手头的问题调整这些算法,而且他们没有意识到你如何表达问题本身很重要。”他敦促处于这种处境的科学家向计算机科学家寻求帮助,其中许多计算机科学家急于将他们的算法设计技能应用到其他领域。

 

矢量微积分

 

   这种合作可以简单地通过与同事讨论自己的工作而产生。这促使苏格兰格拉斯哥大学高级研究员Daniel Streicker将机器学习应用于流行病学中最古老的问题之一:识别病毒载体和储存宿主。

   世界上许多最致命的人类病毒都是人畜共患的,大多数情况下在动物宿主体内复制而未被发现,只是偶尔会传染给人类。当这些传染病通过节肢动物媒介在宿主之间传播时,流行病学家可能要花数十年时间来确定相关的非人类宿主和媒介。然而,近年来,研究人员发现, RNA病毒——最适合在宿主之间跳跃的一类病毒——针对它们主要感染的宿主优化了其基因组的各种特征,包括它们的氨基酸、密码子和二核苷酸的使用。这意味着在病毒的基因组序列中应该有线索可以暗示其宿主和载体的身份。

   作为一名生物学家,Streicker发现这个想法很令人好奇,但不知道该如何继续下去。“我的同事Simon Babayan在我们研究所举办了一场非正式的研讨会,讨论了他正在应用机器学习方法的各种项目,我突然意识到,这可能是应对这一挑战的完美方式,”Streicker说。他们与医学研究委员会—格拉斯哥大学病毒研究中心的生物信息学专家Richard Orton合作,开始构建算法来搜索病毒宿主和载体。

   该团队利用来自具有明确特征生命周期的病毒的基因组序列训练其机器学习系统,让它识别出不同序列特征与特定宿主和载体物种之间的相关性。“你只是想找到这些特征的加权组合,以便你能有效地将基因组的特征映射到其来自的宿主。”Streicker表示。

   训练阶段结束后,他们在另一组已知宿主的病毒上对其进行测试,以验证其可靠性。最后,他们为该系统提供了一组对病因学知之甚少的病毒的基因组,并让它预测病毒的传播模式。

   许多结果证实了现有的理论,但该系统还揭示了一些惊喜。例如,病毒学家认为克里米亚—刚果出血热病毒主要通过蜱媒传播,但计算机预测,牲畜之间的直接传播也可能是主要的感染途径。该算法还预测,除蝙蝠外,非人灵长类动物可能是埃博拉病毒的重要宿主(1)。

   为了优先考虑他们的研究,Streicker的团队现在希望将同样的方法应用于宏基因组学项目中涌现的大量新的病毒基因组序列。“我们正在考虑如何使用类似的方法来尝试预测人类是否会被病毒感染,”Streicker说,“这显然是一个与监测和公共卫生非常相关的问题,因为现在有太多的病毒正在被发现。”虽然他们最初的工作只专注于单链RNA病毒,但他们也希望将该项目扩展到包括其他类型的病毒基因组。

 

做所有的研究

 

   虽然基因组序列已经成为算法驱动研究的主要焦点之一,但其他海量数据集也已成熟,适用于机器学习。例如,在过去的几年里,纽约市哥伦比亚大学欧文医学中心(CUIMC)的研究人员一直在使用各种计算方法来分析海量的电子病历,同时也在研究生物医学文献本身。

   后者的努力使许多人称之为“可重复性危机”的问题引起了人们的关注,即看似有效的不同研究,却得出相反的结论。观察性研究尤其成问题,研究人员利用现有的医疗记录,并追溯性地将患者分为对照组和实验组。近年来,此类研究的结果显示,例如,抗抑郁药会增加或减少自杀的风险,这取决于人们相信哪项研究。CUIMC生物医学信息学主席George Hripcsak指出,“没有两组人选择相同的变量进行校正,然后他们坚持要求你必须选择完全正确的变量。”

   一个相关的问题是,期刊青睐显示积极结果的论文,通常基于一个任意的统计标准。Hripcsak自己对文献的分析表现出了显著的偏差,已发布的p(概率)值(统计显著性的衡量标准)的临界值为0.05。因此,研究人员面临着选择变量和统计技术的巨大压力,这些变量和统计技术将产生可发布的p值,这可能会使他们的分析产生偏差。

   为了解决这个问题,Hripcsak和他的同事们把研究设计的工作交给了计算机。在最近的一个项目中,他们利用了包含数以亿计个体患者医疗记录的多个数据库,并使用一种算法来设计,同时对数据进行所有合理的观察性研究。针对抑郁症,该算法确定了6000个潜在的研究假设和超过55000个控制假设,包括17种治疗、272对联合治疗和22种结果。该算法在一台功能强大的计算机上运行了大约一个月,并对不同治疗方法的影响进行了5984次估计。每一项结果都符合在顶级同行评审期刊上发表论文的当前方法标准。然而,该团队看到了令人欣慰的阳性和阴性结果的分布,这表明他们避免了通常的发表偏见(2)。

   不过,消除人类偏见并不能自动解决问题。“当我们在这个新领域做研究时,我们不想……对我们试图阻止的同样事情感到内疚,因此这就是我们正在研究人工智能可能带来的导致偏见的特殊因素,”Hripcsak说。和该领域的其他人一样,他担心许多机器学习算法的不透明性可能会掩盖令人不安的错误。例如,“经济因素或其他因素(可能)使某些种族群体在治疗中表现不佳,然后系统建议不给予他们这种治疗,而实际上这与他们的种族无关,”Hripcsak说。

   尽管存在这些障碍,但他和该领域的其他人对人工智能研究的未来持乐观态度。“我看到一场革命正在发生,这很棒,”Fogel说。■

 

参考文献

S. A. Babayan, R. J. Orton, D. G. Streicker, Science 362, 577-580 (2018), https://doi.org/10.1126/science.aap9072.

M. J. Schuemie, P. B. Ryan, G. Hripcsak, D. Madigan,M. A. Suchard, Philos. Trans. Royal Soc. A 376, 20170356 (2018), https://doi.org/10.1098/rsta.2017.0356.

 

Alan Dove 是马萨诸塞州的科学作者和编辑。

鸣谢:“原文由美国科学促进会(www.aaas.org)发布在2019 年9月20日《科学》杂志”。官方英文版请见https://www.sciencemag.org/features/2019/09/whenrobots-sleep-do-they-dream-algorithms。

 

 

 

 

《科学新闻》 (科学新闻2021年8月刊 科学·生命)
发E-mail给:      
| 打印 | 评论 |