实验室基础设备

AI自主实验室必须解决的几个关键挑战是什么？

时间：2024-09-30 06:36:22 点击次数：

　　BOB·体育综合APP下载研究实验室的自动化能够大幅加速科学发现。科学界设想了一个能够基于高阶目标和推理能力进行规划、执行和评估实验的“AI科学家”。这需要在实验室环境中全面整合数字孪生技术，以实现更高的自动化和数据管理水平。

　　剑桥大学新加坡中心的Simon D. Rihm教授等人在Cell Press细胞出版社旗下期刊Nexus上发表题为“Transforming Research Laboratories with Connected Digital Twins”的文章，讨论了AI驱动实验的重大进展，以系统性视角揭示了实现完全自主实验室必须解决的几个关键挑战，并介绍了一个包括基础设施和外围设备在内的全方位实验研究框架。

　　面对不断加剧的全球挑战，加快科研进程的紧迫性愈加显著。北野宏明在“诺贝尔图灵挑战”框架内提出设计“AI科学家”：科研工作者们只需设定高阶目标，AI科学家将基于这些目标设计合理的实验，并完全自主执行实验操作和分析实验数据。尖端技术的不断进步，如人工智能和机器人技术，已经使这种自动化达到了前所未有的规模。目前这一发展的高潮是自主实验室（SDL），并且在化学、材料科学和生物技术领域中已获得成功的应用。

　　尽管SDL代表了重大的技术进步，但是其在机器人设置、物料采购、实验监控和设备维护等方面仍需要大量人力参与。最近的SLAS Europe 2023会议上一组专家讨论了“未来实验室”，强调了工作流程整合的必要性，以协调数据、仪器和软件之间的互操作性。考虑到实验研究的跨学科性质，从整体视角分析了科学实验室的三个相关联的方面包括：涵盖基础设施和资源的实验室；承担实际工作的操作者；以及包含设备和软件的固定单位和指导实验设计和分析的基础知识（图1）。

　　为实现整体实验室自动化，论文确定了七个一般性挑战（图2）：互操作性，可适应性，知识深度，协调组织，逻辑推理，目标推导，临时性技术差异。

　　互操作性通常指的是对更多融合功能集成平台的需求。随着外围任务自动化所需知识的不断扩展，对有效管理研究实验动态特性的可适应性需求变得迫在眉睫。为了适应实时数据并实现设置或底层模型的根本性变化，硬件和软件组件都需要采用模块化设计原则。这要求AI科学家积极协调组织研究活动，这不仅将实现远程操作能力，还将促进一个有效的SDL网络的形成。跨领域和规模的必要信息协调需要互操作组件，更重要的是需要对深度知识模型的表征，这包括底层流程（例如量子化学）相关知识。充分的反应、表征和合并被称为知识整合，这是算法具备逻辑推理能力的先决条件,是完全自动化科学发现过程实现“闭环”所必须的，是SDLs发展的主要推手。超越闭环实验，目标推导至关重要：AI科学家将能够从非常抽象的目标（如联合国可持续发展目标）中推导出潜在目标，最终形成实验活动。这种当前状态与期望目标之间的不连续性称为临时技术差距，并不能通过将所有可用解决方案集成到一个统一系统中的单一步骤来解决。

　　文中，作者认为需要进行范式转变来应对上述挑战。随着逻辑推理和目标推导能力的不断提高，人类应在更抽象的层次承担制定目标和任务方面的角色，使自主系统能够定义最佳指令集。为了弥合临时技术差距，论文建议采用“人在回路中”的方法（图3）。虽然物理设置可能仍然由人类完成，但系统会明确地给出指导并记录下来，通过自动化编排来降低成本和环境影响，即选择和订购试剂，并安排和开展实验。

　　创建一个能够在不断变化的三维物理环境中计划和执行所有类型实验的AI科学家，需要从人类专家转向通用知识模型的构建。该模型必须包括与实验研究相关的所有潜在知识深度，以确保与其他系统的互操作性，并可适应不断变化的条件。数字孪生技术需要整合多种领域模型、元数据和物理形状，将基本原理嵌入边界条件，以实现基于物理的建模，而且必须与不同规模的数字孪生进行交互，并不断地适应现实世界的变化。

　　“世界阿凡达（TWA）”是一个开源项目，旨在基于动态知识图谱创建一个全面数字孪生，以将概念、数据和计算代理实时连接起来，形成真实世界的数字“化身”。TWA代表了创建一个随时间演变的通用知识模型的尝试，目标是在更广泛的世界模型中实现自动化实验室，并正在开发相应的全面实验室自动化框架。

　　这个“数字实验室框架”基于对研究实验室的整体视角，必须考虑实验研究的所有方面，如图4所示。作者展示了这一框架及其用于协调两个独立的自动化实验室以实现共同目标的能力。作为朝着预期目标推导的第一步，专门的代理将复杂的目标分解为子目标，使用通用的“派生信息框架”不断更新知识模型，确保知识图谱的持续适应性。与此同时，研究团队也在不断丰富TWA的化学信息，为数据分析和实验规划提供知识深度。研究团队还展示了自动化设施管理任务的实用互操作性，还包括了人在回路中方法的概念验证，通过向实验室用户发送自动警告和指令，以弥合临时技术差距。最后，团队展示了一个用于与TWA进行通信的自然语言处理（NLP）界面，利用大型语言模型（LLM）的能力查询知识图谱。要实现“AI科学家”仍然还有很长的路要走，但作者相信本文提出的方法是最有前途的。

　　综上，进一步自动化实验研究取决于两个关键因素：首先，必须确保从长远来看自动化能够提高效率（从而加速科学发现），而额外的维护、设置和工程工作不会超过其收益。其次，需要确认研究目标和实验活动与高阶目标相一致，同时考虑到短期和长期影响以及实验本身的足迹。作者认为，通过采用系统的视角并创建一个连接的、分布式数字孪生框架来实现整体实验室自动化，是必需进行的范式转变，并提出了一个“数字实验室框架”，以应对各个方面的实验室自动化，创建一个能够实现整体实验室自动化的“AI科学家”。

　　经过50年的不懈努力，Cell Press细胞出版社的编辑与全球的作者、审稿人一起，创办了一系列优秀出版物，未来我们也将不断深耕科研创新和科学信息的传播交流，启迪更多科学新发现。

　　本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

上一篇: 教室、寝室、实验室校园重点区域防患于未“燃”

下一篇: 张占仓：河南重塑重构实验室体系加强基础研究