承诺和陷阱回顾 – 第二部分 » CCC 博客

承诺和陷阱回顾 – 第二部分 » CCC 博客

CCC 在今年的 AAAS 年会上支持了三场科学会议,如果您无法亲自参加,我们将回顾每场会议。本周,我们将总结本届会议的亮点,“科学中的生成人工智能:前景与陷阱”。在第二部分中,我们将总结 Markus Buehler 博士关于机械生物学中的生成人工智能的演讲。

Markus Buehler 博士首先介绍了生成模型如何应用于材料科学研究。从历史上看,在材料科学中,研究人员会收集数据或建立方程来描述材料的行为,并用笔和纸来解决它们。计算机的出现使研究人员能够更快地求解这些方程并处理非常复杂的系统,例如使用统计力学。然而,对于某些问题,传统的计算能力是不够的。例如,下图描绘了单个小蛋白质的可能构型数量(20 ^100  或 1.27×10^130 设计)。这种可能的配置数量大于可观测宇宙中的原子数量 (10^80 原子)使得这个问题即使对于最大的超级计算机来说也变得棘手。 

承诺和陷阱回顾 – 第二部分 » CCC 博客 PlatoBlockchain 数据智能。垂直搜索。人工智能。

在生成模型出现之前,科学家创建的方程和算法受到自古以来所有研究人员共有的某种特征的限制:人性。 “生成式人工智能使我们能够超越人类的想象力,因此我们可以发明和发现迄今为止我们无法做到的事情,要么因为我们不够聪明,要么因为我们没有能力访问每个数据点“同时,”Buehler 博士说道。 “生成式人工智能可用于识别新的方程和算法,并可以为我们求解这些方程。此外,生成模型还可以向我们解释它们是如何开发和解决这些方程的,在高度复杂的情况下,这些方程对于研究人员理解模型的“思维过程”是绝对必要的。”这些模型如何工作的一个关键方面是通过学习信息(例如测量结果)的图形表示将其转化为知识。  

承诺和陷阱回顾 – 第二部分 » CCC 博客 PlatoBlockchain 数据智能。垂直搜索。人工智能。

资料来源:MJ Buehler, 通过生成知识提取、基于图的表示和多模态智能图推理加速科学发现,arXiv,2024

下图显示了一种新的材料设计,一种基于菌丝体的分层复合材料,由生成式人工智能构建而成,具有前所未有的菌丝根状体、胶原蛋白、矿物填料、表面功能化以及孔隙率和材料的复杂相互作用的组合。 

承诺和陷阱回顾 – 第二部分 » CCC 博客 PlatoBlockchain 数据智能。垂直搜索。人工智能。

资料来源:MJ Buehler, 通过生成知识提取、基于图的表示和多模态智能图推理加速科学发现,arXiv,2024。左:Mycrlium 复合材料。右:蛋白质设计。 

此外,生成式人工智能可以帮助我们可视化复杂的系统。人工智能可以用图表来表示这些相互作用,而不是描述原子之间的相互作用,从而机械地描述材料在不同尺度上的功能、行为和相互作用。这些工具很强大,但单独使用它们还不足以解决这些高度复杂的问题。为了解决这个问题,我们可以结合许多模型,例如可以进行物理模拟的模型和可以预测力和应力以及如何设计蛋白质的模型。当这些模型进行通信时,它们就成为代理模型,其中每个单独的模型都是具有特定目的的代理。每个模型的输出都会传递给其他模型,并在模型输出的总体评估中予以考虑。代理模型可以对现有数据进行模拟并生成新数据。因此,对于数据有限或为零的区域,研究人员可以使用物理模型生成数据来运行模拟。 “这种类型的建模是生成模型未来的增长领域之一,”Buehler 博士说。这些类型的模型可以解决以前被认为在超级计算机上难以解决的问题,其中一些模型甚至可以在标准笔记本电脑上运行。

研究人员仍在解决设计此类受物理启发的生成人工智能模型的主要挑战之一,即如何优雅地构建模型,以及如何使它们更类似于人脑或生物系统。生物系统有能力改变它们的行为,例如当你割伤皮肤时,割伤会随着时间的推移而愈合。可以建立模型来执行类似的操作。我们可以训练模型有能力重新组装它们以动态地行动,而不是训练模型始终治愈伤口——从某种意义上说,我们训练模型首先考虑所提出的问题以及它们如何能够重新配置“自己”最好地解决某项任务。这可用于进行定量预测(例如,解决高度复杂的任务以预测蛋白质的能量分布),对结果进行定性预测和推理,并在开发复杂任务的答案时整合不同的专业知识和技能。重要的是,这些模型还可以向我们解释他们如何得出解决方案、特定系统如何工作以及人类科学家可能感兴趣的其他细节。然后,我们可以运行实验来预测和验证这些最有前途的想法案例的模拟结果,例如材料设计应用。

随后 Buehler 博士谈到了这些生成模型在材料科学中的具体应用。 “为了计算能量图来解决给定某种蛋白质的逆折叠问题,我们甚至不需要知道蛋白质是什么样子,我只需要知道定义这种蛋白质的构建模块和 DNA 序列以及该蛋白质的条件。实验是在。如果您想要一种具有一定能量景观的特定蛋白质,我们也可以根据需要设计该蛋白质。代理模型可以做到这一点,因为它们有能力结合不同的模型、预测和数据。这可用于合成自然界中不存在的复杂的新型蛋白质。我们可以发明具有超强纤维的蛋白质作为塑料的替代品,或者创造更好的人造食品或新电池。我们可以利用大自然的工具箱来扩展大自然所提供的东西,并远远超出进化原则。例如,我们可以为某些目的设计材料,例如具有高弹性或具有某些光学特性的材料,或者根据外部提示改变其特性的材料。现在出现的模型不仅能够解决这些问题,而且还提供了向我们解释这些问题是如何解决的能力。他们还可以阐明为什么某些策略有效而其他策略无效。他们可以预测新的研究,例如要求模型详细预测某种材料的行为方式,我们可以通过实验室的研究或物理模拟来验证这一点。这令人难以置信,听起来很未来主义,但它实际上正在发生。”

时间戳记:

更多来自 CCC 博客