ISC 2022上,NVIDIA公布多项重磅合作进展

经过两年的线上会议后,ISC(International Supercomputing Conference)作为 2022 年首个大型高性能计算展会重返线下,这场在德国汉堡举办的会议围绕高性能计算、机器学习与数据分析等场景进行,共有135家参展机构亮相。

在ISC 2022上,高性能计算和人工智能领域供应商NVIDIA宣布了一系列合作,包括量子计算、网络DPU、超级计算机等一系列相关领域的合作,这些前沿科技领域合作,极大增强了英伟达在超算市场的影响力,同时也进一步将其产品和技术应用在更广泛的领域。同时,英伟达还公布了搭载其超级芯片服务器的突破性进展。

量子计算与HPC

数十家量子组织已经在使用 NVIDIA cuQuantum 软件开发套件,在 GPU 上加速其量子电路模拟。

最近,AWS 宣布在其 Braket 服务中提供 cuQuantum。它还在 Braket 上展示了 cuQuantum 如何在量子机器学习工作负载上实现高达 900 倍的加速。

cuQuantum 现已能够在主要的量子软件框架上实现加速计算,包括 Google 的 qsim、IBM 的 Qiskit Aer、Xanadu 的 PennyLane 和 Classiq 的 Quantum Algorithm Design 平台。这意味着这些框架的用户可以访问 GPU 加速,而无需再进行任何编码。

如今,Menten AI 开始使用 cuQuantum 来支持其量子工作。

这家湾区药物研发初创公司将使用 cuQuantum 的 Tensor 网络库来模拟蛋白质相互作用并优化新的药物分子。这样做旨在利用量子计算的潜力来加速药物设计,该领域与化学类似,是公认的率先受益于量子加速的领域。

具体而言,Menten AI 正在开发一套量子计算算法(包括量子机器学习),以解决治疗设计中需要进行大量计算的问题。

Menten AI 的首席科学家 Alexey Galda 表示:“虽然能够运行这些算法的量子计算硬件仍处于开发阶段,但 NVIDIA cuQuantum 等经典计算工具对于推进量子算法的开发至关重要。”

英伟达表示,随着量子系统的发展,下一个重大飞跃是朝混合系统迈进:量子计算机和经典计算机协同工作。研究人员都希望这些系统级量子处理器(即 QPU)成为功能强大的新型加速器。

因此,摆在面前的一个重要任务就是将传统系统和量子系统桥接到混合量子计算机中。这项任务包括两个主要部分。

首先,需要在 GPU 和 QPU 之间建立快速、低延迟的连接。这样一来,混合系统可使用 GPU 完成其擅长的传统作业,例如电路优化、校正和纠错。

GPU 可以缩短这些步骤的执行时间,并大幅降低经典计算机和量子计算机之间的通信延迟,而这是当今混合量子作业面临的主要瓶颈。

其次,该行业需要一个统一的编程模型,其中包含高效易用的工具。

当前,为了对 QPU 进行编程,研究人员只能使用相当于低级组装代码的量子,不是量子计算专家的科学家无法使用这种代码。此外,开发者缺乏统一的编程模型和编译器工具链,因此无法在任何 QPU 上运行工作。

为了高效地找到量子计算机加速工作的方法,科学家需要轻松地将其 HPC 应用的一部分先移植到模拟版 QPU,然后再移植到真正的 QPU。这个过程需要一个编译器,使科学家们能够以熟悉的方式高效工作。

超级计算中心的NVIDIA BlueField DPU 

洛斯阿拉莫斯国家实验室正与 NVIDIA 进行一项为期多年的广泛合作,这项合作旨在将计算多物理应用的性能提高 30 倍。其中包括使用 BlueField 及其 NVIDIA DOCA 软件框架在计算存储、模式匹配等方面实现的创新技术。这些努力还将有助于进一步定义 OpenSNAPI ,这是一个任何人都可用来控制 DPU 的应用接口。将固态存储与 DPU 和 InfiniBand 加速器相结合,可为 Linux 文件系统的关键性能部分提供加速。它的性能高达同类存储系统的 30 倍。

德克萨斯高级计算中心(TACC)近期也开始在 Dell PowerEdge 服务器中采用 BlueField-2。它将在 InfiniBand 网络上使用 DPU ,使其 Lonestar6 系统成为云原生超级计算的开发平台。

俄亥俄州立大学的研究人员展示了 DPU 如何将一个 HPC 热门编程模型的运行速度提高 21%。他们通过卸载消息传递接口(MPI)的关键部分,加速了 P3DFFT ,这是一个用于众多大规模 HPC 仿真的数学库。对于运行药物研发或飞机设计等 HPC 仿真应用的超级计算机而言,高达两位数的性能加速是惊人的。俄亥俄州立大学计算机科学与工程专业的教授 Dhabaleswar K.(DK)Panda 表示,云服务可以利用这些加速提高客户的生产力,他已收到多个 HPC 中心的代码请求。

英格兰北部的达勒姆大学正在开发一款软件,用于在 16 个节点的 Dell PowerEdge 集群上使用 BlueField DPU 以实现 MPI 作业的负载均衡。

剑桥大学、伦敦和慕尼黑的研究人员也在使用 DPU。伦敦大学学院正在探索如何在 BlueField-2 DPU 上为主机系统调度作业。例如,可以使用它的能力在主机处理器之间移动数据,以便在需要时数据已然就位。慕尼黑工业大学计算机体系架构和并行系统组的研究人员正在寻找方法,使用 DPU 来卸载 MPI 和操作系统任务,这是 EuroHPC 项目的一部分。

在美国,佐治亚理工学院的研究人员正在与桑迪亚国家实验室合作,利用 BlueField-2 DPU 加速分子动力学研究。

本月早些时候,日本研究人员宣布将推出一款采用新版 NVIDIA H100 Tensor Core GPU 的系统,该系统将搭载速度更快、更智能的 NVIDIA Quantum-2 InfiniBand 网络平台。NEC 将使用 H100 的为筑波大学计算科学中心构建算力大约为 6 PFLOPS 超级计算机。研究人员将使用该系统实现气候学、天体物理学、大数据、AI 和更多方面的研究。

Cambridge-1 超级计算机打造全球最大的开源合成大脑图像集

伦敦国王学院的研究人员使用 NVIDIA Cambridge-1 超级计算机和 MONAI 打造全球最大的的开源合成大脑图像集,加速了 AI 在医疗健康领域的应用。

NVIDIA Cambridge-1 是致力于在医疗健康领域取得突破性 AI 研究的超级计算机,MONAI 是用于医学成像的 AI 框架。它们共同创建了用于合成数据的 AI 工厂,让研究人员能够运行数百个实验、选择最优的 AI 模型并运行推理以生成图像。

NVIDIA DGX SuperPOD Cambridge-1 配备 640 个 NVIDIA A100 Tensor Core GPU,每个 GPU 均具有足够的显存,可以处理团队海量图像中一或两张包含 1600 万个 3D 像素的图像。

MONAI 的基础模组包括特定领域专用的数据加载程序、指标、GPU 加速转换和经过优化的工作流引擎。Cardoso 表示,该软件的智能缓存和多节点扩展最高可将作业加速 10 倍。

新一代超级芯片服务器

多家计算机制造商正在采用全新NVIDIA Grace超级芯片打造新一代服务器,为超大规模时代的AI和HPC工作负载提速。

源讯、戴尔科技,技嘉科技、慧与、浪潮、联想和超微宣布计划部署基于NVIDIA Grace CPU 超级芯片和NVIDIA Grace Hopper超级芯片的服务器。

超级芯片既不是CPU,也不是GPU,而是联合体。

NVIDIA Grace CPU超级芯片搭载两个基于Arm的CPU,它们通过高带宽、低延迟、低功耗的NVIDIA NVLink-C2C互连技术连接。这项开创性的设计内置多达144个高性能Arm Neoverse核心,并且带有可伸缩矢量扩展和1 TB/s的内存子系统。

Grace CPU超级芯片支持最新的PCIe Gen5协议,可实现与GPU之间最高性能连接,同时还能连接NVIDIA ConnectX-7智能网卡以及NVIDIA BlueField-3 DPU以保障HPC及AI工作负载安全。

Grace Hopper超级芯片在一个集成模块中通过NVLink-C2C连接NVIDIA Hopper GPU与NVIDIA Grace CPU,满足HPC和超大规模AI应用需求。

洛斯阿拉莫斯国家实验室与瑞士国家计算中心也都同时宣布,将率先使用NVIDIA超级芯片。

这一系列合作均表明,NVIDIA在HPC领域,正在拥有更强大的话语权和生态系统。