2022年9月20日, NVIDIA宣布与麻省理工学院和哈佛大学旗下的博德研究所(The Broad Institute)合作,为Terra云平台提供快速分析海量医疗数据所需的AI和加速工具。这将惠及该平台的25000多名用户,这些用户包括来自学术界、初创企业和大型制药公司的生物医学研究人员。
此次合作旨在将NVIDIA在AI领域的专长和医疗计算平台与博德研究所的全球知名研究人员、科学家和开放平台建立连接,重点关注三大关键领域:
- 在Terra平台上提供NVIDIA Clara™ Parabricks®:Parabricks是一款用于测序数据二级分析的GPU加速软件套件,现可用于六个新的Terra工作流程。用户现在可以使用Clara Parabricks,在一个多小时内完成全基因组的分析,而在基于CPU的环境中这项工作需要24个小时才能完成,并且,使用Parabricks计算成本降低一半以上。
- 构建大型语言模型(LLM):为深入探究人类生物学,研究人员将使用今日发布的用于生物学LLM模型的AI应用框架——NVIDIA BioNeMo,来开发DNA和RNA(生命的“基础构件”)的基础模型。
- 为基因组分析工具包(GATK)带来更加强大的深度学习:NVIDIA正致力于为10多万名研究人员所使用的行业标准工具——博德研究所的GATK工具包打造新的深度学习模型,帮助研究人员识别与疾病相关的基因变异。这将助力新药研发人员研究新的疗法。
NVIDIA医疗业务副总裁Kimberly Powell表示:“整个医疗生态系统都需要更先进的计算工具,以便我们在理解疾病、发展诊断学和提供治疗方案的方面取得突破。通过扩大与博德研究所的合作,我们可以发挥大型语言模型的力量,最终提供联合解决方案,让研究人员的深入洞察能够真正地造福患者。”
博德研究所希望通过提供一个开放的云平台,将研究人员相互联系起来,并将研究人员与其实现科学突破所需的数据集和工具连接起来,从而实现新一代生物医学合作研究。
博德研究所首席数据官Anthony Philippakis表示:“生命科学领域正处于一场数据革命之中,研究人员迫切需要一种将机器学习引入生物医学的新方法。我们希望通过此次合作,进一步践行‘数据共享与合作流程’的使命,进而扩展基因组学研究。”
用于疾病研究的大型语言模型
NVIDIA的BioNeMo框架包含蛋白质和化学领域的预训练LLM模型,可简化训练、推理和扩展。BioNeMo是NVIDIA NeMo Megatron框架针对化学、蛋白质和DNA/RNA序列领域的扩展。
通过BioNeMo,开发者能够有效地训练和部署具有数十亿参数的生物学LLM模型。
双方团队将基于此次合作,共同创建新的模型,将其添加至BioNeMo集合中,并在Terra平台上提供。
用于特定领域AI的NVIDIA软件
NVIDIA Parabricks GPU加速的工作流程为研究人员提供更快的周转时间和更低的成本,以进行广泛的基因组数据分析。在博德研究所的GATK最佳实践——生殖细胞突变检测分析流程中,Parabricks在GPU上进行分析的速度提高了24倍,而成本减半。
博德研究所的研究人员还能够访问用于医学影像AI的开源深度学习框架——MONAI以及用于加快数据准备工作的GPU加速数据科学工具包——NVIDIA RAPIDS™。后者可用于基因组单细胞分析。
进一步了解Clara Parabricks与Terra的集成,并注册申请NVIDIA BioNeMo LLM服务抢先体验。
观看NVIDIA创始人兼首席执行官黄仁勋的GTC主题演讲,进一步了解NVIDIA与博得研究所的合作。