Open AI 宣布和洛斯阿拉莫斯国家实验合作:首次实际实验室环境中测试多模态AI

刚刚OpenAI和洛斯阿拉莫斯国家实验室宣布生物科学研究合作伙伴关系

合作目标:研究如何在实验室环境中安全使用AI推进生物科学研究

评估重点:

  • 测试GPT-4o等前沿多模态AI模型在实验室环境中的应用
  • 评估AI如何协助专家和新手执行实验室任务
  • 首次在实际实验室环境中测试多模态AI
  • 结合湿实验室技术(wet lab techniques)和多模态输入(文字、语音、视觉)

官宣全文

OpenAI与美国领先的国家实验室之一洛斯阿拉莫斯国家实验室(LANL)合作,研究如何在实验室环境中安全使用人工智能来推进生物科学研究。这一合作延续了美国公共部门,特别是国家实验室,与私营部门合作的传统,确保创新成果能够转化为医疗保健和生物科学等重要领域的进步‍

根据最近的白宫关于人工智能安全、可靠和可信开发与使用的行政命令,美国能源部的国家实验室负责评估前沿AI模型的能力,包括其生物学能力。这对OpenAI非常重要,因为我们相信AI有潜力加速科学研究的速度和影响。目前,Moderna利用OpenAI的技术增强了临床试验开发,通过建立数据分析助手来分析大型数据集。Color Health使用GPT-4o建立了新的助手,帮助医疗提供者做出基于证据的癌症筛查和治疗决策‍

OpenAI首席技术官Mira Murati表示:“作为一家致力于公共利益的私营公司,我们很高兴宣布与洛斯阿拉莫斯国家实验室的首次合作,研究生物科学能力。这一合作是我们推进科学研究使命的自然进展,同时也在理解和减轻风险。”

洛斯阿拉莫斯国家实验室的信息系统和建模副组长Nick Generous说:“AI是一种强大的工具,在科学领域有巨大潜力,但与任何新技术一样,也伴随风险。在洛斯阿拉莫斯,这项工作将由新成立的AI风险技术评估小组领导,以帮助评估和更好地理解这些风险。”

OpenAI和洛斯阿拉莫斯国家实验室的生物科学部正在进行一项评估研究,以评估像GPT-4o这样的前沿模型如何通过视觉和语音等多模态能力,在物理实验室环境中帮助人类执行任务。这包括对GPT-4o的生物安全评估及其尚未发布的实时语音系统的研究,以了解它们如何支持生物科学研究。我们相信,这将是首个此类评估,并将为AI生物安全评估的前沿研究做出贡献。这项研究将基于我们现有的生物威胁风险研究并遵循我们的准备框架,该框架概述了我们在2024年首尔AI峰会上达成的前沿AI安全承诺‍

我们即将与洛斯阿拉莫斯进行的评估,将是首个在实验室环境中测试多模态前沿模型的实验,评估专家和新手在执行和排除安全协议方面的能力,这些协议包括标准的实验室实验任务。这些任务旨在作为更复杂任务的替代,具有双重用途的担忧。任务可能包括转化(例如,将外源基因物质引入宿主生物);细胞培养(例如,体外维持和繁殖细胞);和细胞分离(例如,通过离心)。通过检查GPT-4o在任务完成和准确性方面的提升,我们旨在量化和评估前沿模型如何提升现有专业人员和新手在实际生物任务中的技能‍

这些新评估在多个新维度上扩展了我们以前的工作:

  1. 引入湿实验技术。合成和传播化合物的书面任务和响应具有指示性,但并不能完全涵盖实际进行生物实验工作所需的技能。例如,知道必须进行质谱分析或详细说明步骤可能很容易,但正确地进行,使用真实样本则要困难得多‍‍
  2. 引入多种模式。我们以前的工作集中在GPT-4,涉及书面输出。GPT-4o在跨模态推理和接受语音和视觉输入方面的能力可能会加快学习速度。例如,对湿实验室设置的所有组件不太熟悉的用户可以简单地向GPT-4o展示他们的设置,并通过摄像头进行视觉排除故障,而不是需要以书面问题的形式传达情况‍‍

洛斯阿拉莫斯国家实验室在安全研究方面一直处于领先地位,我们期待与之合作进行前沿AI模型的新颖和强有力的安全评估,随着能力的快速提升。这一合作不仅强调了像GPT-4o这样的多模态AI模型支持科学研究的潜力,也强调了私营和公共部门合作在利用创新和确保安全方面的关键重要性。我们期待这些评估的结果,希望这一合作伙伴关系能帮助设定AI在科学领域安全性和有效性的新标准,为造福人类的未来创新铺平道路。