英伟达AI“核弹”问世,推理性能提升30倍,“非常非常大!”

关于「算力豹」(微信公众号搜索:dethinktank)
 ▌Blackwell新架构在万亿参数级的大模型的成本和能耗较前代改善25倍 

30年来,人们一直追求实现加速运算和AI等变革性突破, 生成式AI是当前决定性技术。生成式 AI 的下一步是多模态和视频,也就意味着更大规模的训练。相对的是,算力市场也在升温,硬件和软件方面的竞争都在加剧。

而英伟达带来的产品总是再次将AI芯片的标杆推向了难以想象的高度。全球的科技公司都还在争抢Hooper(H100)芯片,但新一代产品已来。

今天凌晨四点,加州圣何塞,在堪比科技界伍兹塔克(Woodstock)音乐节的GTC大会上,英伟达推出新一代AI图形处理器芯片(GPU)架构Blackwell,并重磅发布采用该架构的GPU——B200GB200产品系列。GB200集成了1个Grace CPU和2个B200 GPU,号称是全世界最强大的Grace超级芯片。

Blackwell新架构代表了迄今为止功能最强大的AI芯片架构!拥有2080亿个晶体管的GPU,定制台积电4nm工艺制造,通过NVLink连接实现高速通信;运行实时生成式AI在万亿参数级的大型语言模型(LLM)的成本和能耗较前代改善25倍

图:黄仁勋右手举着Blackwell,左手举着Hopper GH100 GPU;图源:GTC大会

这是块非常非常大的GPU!”黄仁勋谈道,他对着尺寸比较大颗的Hopper GH100 GPU打趣地说“没关系,你很棒,很棒的成长”。

正如此前外媒DigiTimes爆料,Blackwell架构GB200之所以这么“大”,是因为这是英伟达首个采用MCM(多芯片封装)设计的GPU,在同一个芯片上集成了两个GPU。

据了解,GB200驱动系统可通过新Quantum-X800网络获得800Gb/s超高速网络。此外,英伟达还推出GB200 NVL72液冷机架级系统,集成36个Grace Blackwell超级芯片,与传统H100 GPU相比,在大模型推理上可提升30倍性能。,时长00:20

图:Blackwell架构

新一代SuperPOD超算 撑起百万亿参数模型想象力

随着AI对全领域的渗透和算力加紧加急部署,不断变化的项目需求使得互联网公司正在谋求一种更加安全、便捷、大规模、可扩展、数据可隔离的集群式解决方案。

在本届GTC大会上全新升级的 DGX SuperPoD,也为企业对u万亿模型的探索提供了一份极其重要的保障。

英伟达基于GB200系统,发布新一代DGX SuperPOD超级计算机平台,采用液冷设计,提供11.5 exaflops AI运算能力

DGX SuperPOD是专门为AI量身定制的大规模、安全、可扩展的超级计算机。可扩展至数万个GB200超级芯片,并透过NVLink连接576个Blackwell GPU,获取庞大共享内存。该平台具备智能管理和持续运行能力,将极大推进大规模生成式AI的部署。

图:SuperPOD;图源:GTC大会

除SuperPOD外,英伟达也推出DGX GB200系统,提供144 petaflops AI性能、1.4TB GPU内存,且比上代快15倍。B200支持DGX SuperPOD配置,为企业部署AI提供弹性。

入局具身智能 发布多模态AI项目GR00T

当AI大模型有了身体,会是什么样?从Figure 01身上已隐约可见人类与AI共存的未来

在今天的GTC大会中,英伟达还公布了人形机器人项目GR00T。黄仁勋展示了多个由GR00T驱动的人形机器人如何任务,包括来自Agility Robotics、Apptronik、傅利叶智能(Fourier Intelligence) 和宇树科技(Unitree Robotics)的机器人产品。亮点有:

▌使用其数位孪生技术,让机器人可以在虚拟世界不会摔断腿就可以学会走路、挥手

▌英伟达将会提供Robotic Foundation Model,加速机器人时代来临

GR00T于英伟达的Isaac机器人平台工具,基于新的通用基础模型,GR00T 驱动的人形机器人能够接受文本、语音、视频甚至现场演示的输入,并对其进行处理以采取特定的操作,包括理解自然语言、模拟人类行为、在现实世界中导航和交互。英伟达还开发了一种新型“机器人大脑”计算芯片 Jetson Thor,能够执行复杂的任务并使用 Transforme 引擎处理多个传感器。

人形机器人赛道近期达到了一个新的火热程度,正如黄仁勋所说“机器人的ChatGPT时刻可能即将到来”。

结语

当黄仁勋又很淡定的在自家厨房里开完了GTC发布会,我们知道这场“AI核弹”轰炸的影响将一直持续下去。

“通用计算已经失去动力,现在我们需要更大的模型,我们需要更大的GPU,更需要将GPU堆叠在一起。”黄仁勋说道。“这不是为了降低成本,而是为了扩大规模。”GB200预计将在今年晚些时候发货。

随着AI对全领域的渗透,英伟达超级芯片Blackwell、超算SuperPOD、人形机器人项目GR00T等产品的发布,使得造万亿模型获奖成为可能,甚至打开了通往十万亿,乃至更大想象力算力AI模型探索的潘多拉魔盒。 

参考链接:https://www.nvidia.cn/gtc-global/keynote/

*关于「算力豹」,微信公众号搜索:dethinktank