NVIDIA揭开 AI 背后的武林秘籍

10 月 17 日举行的《数据处理器: DPU 编程入门》新书发布会上,NVIDIA 全球副总裁,中国企业营销负责人刘念宁一袭古风武侠装束,分享并透露了NVDIA AI背后的武林秘籍:三“芯”加二“意”,打造(AI)世界。

NVIDIA 全球副总裁,中国企业营销负责人刘念宁(右)、NVIDIA 中国区工程和解决方案高级总监赖俊杰(左)携手《数据处理器: DPU 编程入门》新书发布

三芯:CPU、GPU和DPU;二意:CUDA和DOCA;AI世界就是以AI为核心应用的世界。其中,CUDA和GPU已经被AI技术开发人员所熟知,并得到了广泛的应用,成为了生成式AI等深度机器学习的基石。相比CUDA和GPU,DPU和DOCA会是下一个辉煌吗?

在《数据处理器: DPU 编程入门》的序言中,对于DPU有这样的描述:可以与CPU和GPU等处理芯片以及其他设备协同工作,紧密配合,实现数据处理任务在多个芯片之间的优化、分配和协同,进一步释放CPU的处理能力,最小化延迟,从而提高数据中心集群和整体数据处理的性能。

注意这里特别强调释放CPU的处理能力,那么是不是也可以释放GPU的处理能力呢?在采访中,我问了这个问题,主要的考虑是在AI大模型训练中,同样存在着GPU利用率的问题,那么DPU可否协助解决呢?答案是肯定的,DPU可以通过NVIDIA GPUDirect技术和NVIDIA DOCA GPUNetIO API库优化GPU的数据访问和传输,可以在CPU不干预的情况下执行网络和计算任务,并实现网络与GPU之间的直接通信。

正如 NVIDIA 创始人兼首席执行官黄仁勋在发布 DPU 时所表示的那样:“DPU 将与 CPU、GPU 成为未来计算的三大支柱,数据中心将成为新的计算单元”。通过把数据中心基础设施操作从 CPU 卸载到 DPU 上,可以将 CPU 和 GPU 的计算资源集中到应用程序和业务负载上。这是数据中心演变的大势所趋,也是推出 NVIDIA® BlueField® 系列 DPU 的核心价值。

《数据处理器: DPU 编程入门》 内容目录

NVIDIA DOCA 是一个为 NVIDIA BlueField 系列 DPU 量身定做的软件开发环境, 在程序开发和服务方面扮演着灵魂的作用,是释放 DPU 潜力的关键。据透露,全球 DOCA 开发者中将近一半来自中国。为了帮助更多的中国开发者, NVIDIA十余位资深系统架构师,历经数月编写该图书,其内容涵盖 DPU 简介、技术优势及未来技术发展路径,包括NVIDIA BlueField 系列 DPU 在结构通用化、功能多样化、应用广泛化和场景丰富化方面的前景展望,NVIDIA DOCA 软件开发环境配置,以及基于NVIDIA BlueField 系列 DPU 利用 NVIDIA DOCA 软件开发环境的程序开发实践案例。

NVIDIA 全球副总裁,中国企业营销负责人刘念宁表示: “在生成式 AI 时代,DPU 是企业构建加速计算平台、AI工厂的关键。NVIDIA BlueField 系列 DPU 在 NVIDIA DOCA软件开发环境的支持下,能帮助企业构建一个软件定义、硬件加速的数据中心基础设施,从而更好地支撑大模型训练的苛刻要求,值得广大开发者投入研究和学习。”

NVIDIA 中国区工程和解决方案高级总监赖俊杰表示: “全球企业正在从通用计算向加速计算和生成式 AI 转变,DPU 作为全新的处理器类型,满足了数据中心基础设施在性能、效率、规模、弹性、安全和能效等方面的需求。软件开发者和数据科学家可以通过本书深刻地理解NVIDIA BlueField 系列 DPU 和 NVIDIA DOCA 软件开发环境,并利用它们构建云和 AI 应用所需的数据中心基础设施。”

百度智能云技术委员会主席王耀: “这是一本由浅入深介绍 NVIDIA BlueField 系列 DPU 及 NVIDIA DOCA 软件框架的入门书籍,内容覆盖了DPU 及其编程开发的方方面面,让读者从更官方的资料中轻松获得构建软件定义、硬件加速的数据中心基础设施应用程序或服务的基础知识,并通过DOCA开发环境和实践用例,逐步掌握编程开发技能。”

UCloud 联席 CTO 王凯: “人工智能正在呈爆发式发展,成为数据中心算力需求的主要驱动力之一。为了卸载、加速和隔离数据中心基础设施工作负载,DPU 应运而生。本书是一本应用NVIDIA BlueField 系列 DPU 和NVIDIA DOCA 的实用指南,使开发人员和数据科学家能走近 DPU 的应用和编程,是一本非常好的 DPU 入门书籍。”

VMware 资深总监兼中国区云平台部门总经理宋向军: “本书是全球第一本系统性介绍 DPU 及其软件开发的书籍,对 DPU 在现代数据中心中的应用有重要的普及作用。广大读者能深入了解DPU 的技术发展、软硬件特性、软硬件安装、开发环境实践、应用用例和生态体系。对期望从事基于NVIDIA BlueField 系列 DPU 进行软件开发的开发人员有非常好的学习和借鉴意义。”

EE Times China 资深产业分析师黄烨峰: “社会数字化转型浪潮下,潜在海量数据待处理,DPU 的边界、职能、价值都尚在探讨前期。而本书从硬件到软件,定义到应用实操,技术特性到生态体系,对 DPU 做了概论式解读;是了解 DPU 自身技术与市场的窗口,亦为开启 DPU 开发实践的上佳入口。”