​实地感受2024 AMD Tech Day:AI引领个人计算的光明未来

2024年7月9日,2024 AMD Tech Day在美国洛杉矶The Westin Bonaventure Hotel & Suites举行,这家酒店因后现代主义设计闻名。而会议之所以选址这家酒店,更大程度上与其成为多个大片的拍摄地有关,诸如《真实谎言》、《碟中谍III》以及《千钧一发》、《全民超人》、《星际穿越》等。

记得这个场景出现在哪个影片中吗?

一提到大片,我们会不由自主地想到那些美轮美奂的精彩视角与镜头。它们毫无例外都与IT高科技密切相关。而AMD正是其中的代表之一。

AMD副总裁兼客户渠道业务总经理 David McAfee

AMD 公司副总裁兼客户渠道业务总经理 David McAfee在开幕致辞中兴奋地表示,跟这些大片相比,更有趣的将是第三代锐龙AI移动平台与 锐龙9000系列台式机处理器两款最新产品的全球首映,预示着个人计算的新纪元。

“在这个世界急剧变化的时代,行业正在被AI重塑,AI PC也正在改变人们工作、沟通和娱乐的方式。”David McAfee表示,AMD正藉由Zen 5 CPU核心、核显架构RDNA 3.5、XDNA 2 NPU引擎以及更长的电池寿命提供支持的锐龙系列处理器引领这一转变。

Zen 5为上述平台带来的惊人的16% IPC提升,为第三代锐龙 AI平台带来卓越的性能,满足游戏玩家和创作者的需求。

AI PC带来强劲需求,处理器生态大放异彩

AMD 高级副总裁,计算与图形事业部总经理 Jack Huynh分享了AMD在推进计算和图形技术方面取得的显著成就。他强调AMD专注于技术创新的成果,指出了Zen架构、3D V-Cache技术和AI处理单元的成功,帮助华硕、宏碁、惠普、联想、微星微星等在内的更多企业专注于创建满足个人需求和偏好的适应性设备,利用芯片和处理器带来的创新成果改变个人计算的愿景。

AMD高级副总裁,计算与图形事业部总经理Jack Huynh(右)与华硕高级副总裁Shawn Yen

Jack Huynh把他的好朋友、华硕高级副总裁Shawn Yen邀请上台,展示了新推出的、搭载第三代锐龙 AI处理器,适合多任务处理、创造性工作和游戏的ZenBook系列笔记本电脑,这些电脑拥有高达24GB的内存和45w集成显卡。据悉,采用最新技术的华硕笔记本电脑,允许进行本地AI处理,同时还增强了面部识别和活动识别等多媒体功能。

Shawn Yen表示,“与Apple笔记本电脑M3相比,搭载AMD第三代锐龙 AI处理器的华硕笔记本电脑性能要高出2.8倍。“

会议期间,华硕还重点展示了其高性能笔记本电脑、时尚的游戏笔记本电脑和经济实惠的桌面伴侣,所有这些都是为速度、便携性和效率而设计的;宏碁、惠普也展示了炫酷超群的桌面机系列。

Zen 5:从CPU微架构到宏大叙事的人工智能

AMD执行副总裁兼首席技术官Mark Papermaster透露了Zen 5架构在处理器性能和架构方面的重大改进,包括重新设计的前端、更广泛的执行通道以及增强的分支预测功能,以及支持矢量数据路径和改进加载存储操作。

AMD执行副总裁兼首席技术官Mark Papermaster

来自Geekbench 5.4的基准测试数据显示,Zen 5架构指令分派率实现翻番至每周期8条指令,为算术逻辑单元(ALUs)引入统一调度程序以提高效率,执行窗口至40%,数据缓存增加50%以保持低延迟。

这些变化旨在更好地处理更大的指令集,并增强数据通过处理器的移动,特别是支持更大的矢量数据路径和改进负载存储操作,同时提高整体系统效率。当然,它们也都是众所周知的微架构设计中最重要的元素。

Mark总结出Zen 5架构的三大特点:一是采用更快、更小和更低功耗的晶体管,优化、节能和高性能,二是采用4nm甚至3nm领先制程技术,增强型金属堆,并继续深化与台积电合作;三是模块化设计,可应用到桌面、服务器、客户端和嵌入式。

具体到产品层面,新一代的Zen 5架构包括Zen 5、Zen 5 V-Cache和Zen 5c三种设计,涵盖 锐龙9000系列台式机处理器、带有AI功能的移动平台第三代锐龙(代号“Strix Point”)以及面向服务器平台的第五代EPYC(代号“Turin”),均提供4nm和3nm版本。

新一代NPU:XDNA 2架构显著提升AI计算能力

AI的爆炸式增长正影响着所有的领域和企业,包括云、嵌入式和端点市场。企业正在将AI融入其传统工作负载以解决新问题,基于深度学习快速开发新模型。

从传统的ML到高级神经网络的快速演变,对NPU一类高效的人工智能处理架构产生了新的需求。AMD的NPU源自其嵌入式计算传统,为AI应用程序提供了高计算密度。其XDNA架构采用了具有动态互连的空间theta流设计,可创建自定义计算内存层次结构,从而实现对AI工作负载至关重要的高效数据移动和实时处理。该架构支持TB级的东西向带宽,通过引入块浮点数据类型等创新,改进了对非线性函数的支持,从而显著提高了AI计算能力。

XDNA 2架构以其卓越的AI计算效率,为行业带来沉浸式AI体验,其计算能力是前代产品的五倍,同时能效也实现了翻倍。

AMD高级副总裁,人工智能  Vamsi Boppana

据AMD 高级副总裁,人工智能  Vamsi Boppana介绍,XDNA 2引入了块浮点16数据格式,使开发人员能够以几乎与16位操作相同的精度实现8位性能。这一突破解决了AI开发中的一个共同挑战,即计算能力和模型准确性之间的权衡。通过支持这种新的数据类型,XDNA 2使开发人员能够更有效地部署模型,与更高精度的格式相比,最小化准确性损失。

XDNA 2平台非常适合作为语言模型的训练和推理基础。得益于AMD Instinct MI300系列加速器的高性能计算能力,以及针对大型语言模型(LLM)优化的丰富算法和工作研究成果,在使用2B序列长度的情况下,基于XDNA 2的7B参数的大型语言模型(LLM 7B)展现出了卓越的性能。采用具备NPU架构的锐龙第三代AI处理器运行时,该模型的性能比搭载了英特尔Ultra 7 155H NPU处理器的系统高出了5倍。

AMD 锐龙7040系列处理器是业界第一个集成了NPU AI 引擎的x86处理器。事实上,AMD与微软等行业领导者在Copilot Plus体验的合作,展示了这些创新的实际影响,为下一代AI应用铺平了道路。Vamsi Boppana表示,XDNA 2架构在5G通信、国防、实时广播、医疗影像处理等领域有着广泛的应用前景。

对话:AI驱动个人计算的光明未来

在与技术专家的对话中,AMD高级副总裁兼客户业务总经理Rahul Tikoo 分享了公司的战略方向,突出强调了AI在塑造个人电脑行业未来中的关键作用。他肯定了AMD在将AI整合到所有计算形式中所付出的努力,此举不仅推动了AI处理单元的进步,更培育了一个充满活力的软硬件生态系统。

AMD高级副总裁兼客户业务总经理Rahul Tikoo (左一)主持对话

Rahul Ttikoo此前就职于AMD,在戴尔工作了12年后于近期重返AMD。

参与对话的嘉宾包括Jack Huynh,负责处理CPU、GPU、软件和合作伙伴关系并将其整合到客户图形和定制化业务中,Mark Papermaster参与Zzen架构的设计,Vamsi Boppana则致力塑造AMD AI战略。

Jack Huynh认为,过去25年来AMD一直在致力于创造最沉浸式的体验和最直观的自然形式,AI PC实际上就是这个旅程中最自然也是最有可能改变整个PC行业的下一个行程。从6年前开始,AMD在嵌入式、GPU等领域的工作支持了多代超级计算机的推出并且应用于Mmeta、Oracle、微软等大量用户,为人类畅想AI奠定基础。借助AI PC和人工智能,如果每人每天可以节省一两个小时,对人类来说意味着巨大的贡献。当然,人工智能的作用是双面的,有些甚至是破坏性的。只有拥抱创新和变革,改变用户体验,才能处于推动这一变革的最前沿。

“AMD正在将超级计算覆盖到最高效的服务器,包括CPU、服务器和数据中心,以及数据中心的GPU加速器,当然也包括消费领域,PC和图形以及嵌入式半定制,这将成为一个广泛的投资组合。”Mark Papermaster指出,“AMD致力于推动每一代引擎的能效提高,作为第一家采用Chiplet的公司,AMD加大对软件堆栈的投资来实现高性能和能效,完成了从以硬件为中心到硬件和软件的协同设计的公司的转型。“

对话嘉宾还讨论了空间数据流架构在创建差异化NPU中的重要性,借鉴了该领域多年的经验。它强调了AI解决方案需要与预处理和后处理阶段集成,以加速最终应用程序,指出了设计满足严格安全和实时约束的架构的重要性,特别是在自动驾驶汽车系统等关键应用中。大家一致认为,与像微软这样的主要技术参与者合作的方法被列为跨部门开发AI PC的全面计划的一部分。

这些讨论和展示标志着AI驱动个人计算的光明未来,预示着技术革新和用户体验的新时代。