第四代EPYC处理器已近巅峰,但AMD前方道路宽且更广

2017年,AMD重新进入服务器市场时,发布了这样一份的产品路线规划图。

AMD EPYC处理器路线图

六年过去,历经全球疫情和经济持续动荡局势,AMD的产品线之路越拓越宽。

AMD数据中心解决方案集团公司副总裁Ram Peddibhotla

“这张幻灯片上透露了两个关键信息,一是我们按时交付了所有的产品,二是每一个产品都提高了性能。” 6月13日,在旧金山召开的 “数据中心和人工智能技术首映式(Data Center and Al Technology Premiere)”上,AMD数据中心解决方案集团公司副总裁Ram Peddibhotla指着这张路线图说:“准时交货和高性能的结合,为我们的客户带来了巨大的价值。”

开疆拓土的AMD EPYC处理器

从AMD EPYC处理器产品路线图可以看出,“重返江湖”后AMD先后推出的前两代EPYC处理器Naples、Rome都是单项产品,到了2021年3月,AMD第三代EPYC 处理器Milan开始“衍生”出了它的兄弟产品Milan-X——最大的革新是采用了名为3D V-Cache堆叠缓存的技术;2022年11月,第四代EPYC 处理器Genoa正式问世,半年后的今天,Genoa-X 、Bergamo亮相,另一款产品Siena也将于年内推出。

AMD第四代EPYC处理器家族图

目不暇给的产品发布背后是这样的一个事实:从第三代EPYC处理器开始,AMD不再是以一个CPU包打天下,第四代EPYC处理器更是根据市场做了细分,除了保持传统优势的通用型产品,还针对云原生应用、计算技术以及面向电信与边缘端演绎拓展,产品家族越来越丰富的同时,为客户需求提供更加精准的解决方案和服务。

此举无疑受到了合作伙伴和客户的欢迎。

6月13日,出席Data Center and Al Technology Premiere的戴尔投资组合管理和战略主管Shekhar Mishra介绍说,戴尔是致力于把最好的解决方案给到客户,帮助他们更好地拓展业务;AMD提供了具有高性价比、高能效而且有非常理想的核心数量的优秀的解决方案,对那些已经应用戴尔及AMD产品的客户而言,理论上无需花精力去升级更换系统和平台,大大降低了各方面的成本。

此前,戴尔已经基于AMD EPYC处理器 Genoa,发布了面向虚拟化、NFV和HCI的计算密度型服务器PowerEdge R6515 &R6615,面向密集虚拟环境和VDI提供灵活性和高性能的PowerEdge R6525 &R6625服务器,面向数字制造、研究和网络技术等HPC密集计算环境的PowerEdge C6525,用于数据数据处理、虚拟化和SDS,具有可扩展性和灵活性的PowerEdge R7515&R7615服务器,面向全闪存SDS、VDI和数据分析型,具有大规模可扩展性的PowerEdge R7525 & R7625,以及用于AI/ML和HPC的一体化服务器PowerEdge XE8545。

戴尔投资组合管理和战略主管Shekhar Mishra

与针对云原生工作负载优化的Bergamo处理器的发布同步,戴尔上述所有产品线中,除了PowerEdge XE8545之外全部进行了升级,为双方共同的客户加速向云转型提供支撑。

合作伙伴的站台,让AMD的EPYC服务器策略“昭告天下”。Ram Peddibhotla 告诉媒体:“我们的服务器策略有三项内容,一是提供世界上性能最高的通用数据中心CPU,二是针对各种工作负载提供优化的芯片解决方案,三是建立和完善全系列的产品解决方案与生态系统,和合作伙伴一起加速价值实现。”

1.支持EPYC服务器策略的Chiplet架构

支持EPYC服务器策略的Chiplet架构

Ram Peddibhotla表示,支持AMD的EPYC服务器策略的是AMD具有行业领先地位的小芯片(Chiplet)架构,其特性是超越摩尔定律,模块化、可配置设计,领先的工艺节点,先进的包装3D堆叠技术,可加速性能提升、降低电力和成本效率。

2.Genoa发布已半年,仍然可圈可点

回顾去年发布的Genoa,他满满的溢美之词:基于小芯片打造的EPYC第四代处理器,是最快的通用数据中心处理器——能源效率极高,具有领导跨工作负载和行业的TCO,强大的安全性为机密计算提供动力,亦具备丰富的解决方案生态系统——因此,EPYC第四代处理器Genoa “是世界上最好的数据中心CPU”。

2P SPECrate_2017_int_base、2P Enterprise Server-Side Java、2P VMmark 3.1.1、2P SAP Sales 8 Distribution等平台提供的测试数据为Ram Peddibhotla的观点提供了证明。

64核的AMD EPYC 第三代处理器7763发布时,对标的是当时英特尔最优的至强8490H处理器,二者的指标已经几乎并驾齐驱;此次发布的94核AMD EPYC 9654处理器,领先度已经远远超出该款至强处理器。

“你看,无论是运行JAVA还是SAP,事实上EPYC第四代 9654处理器的性能是非常有优势的。”临时客串翻译工作的中国市场总监Linda觉得她的低调用词不够忠实于原意,赶紧更正:“抱歉,这个应该是遥遥领先!”

以更小的投资实现更大的回报

在体现云计算效能的2P SPECrate 2017_int base / CPU 1Ku $ 基准测试中,第四代EPYC 9654的成绩为1800分,远超英特尔至强8490H处理器的1000分,第三代EPYC7763的成绩为861分,效能提高了107%。换句话说,EPYC 9654以不到一半的成本,收获了同样的性能,相当于每美元的性能比高出158%。

因此,在云经济效益方面, AMD EPYC 处理器以更小的投资实现了更大的回报。

在体现高性能计算能力的SPECrate_2017_fp_base基准测试中,EPYC9654的成绩为1480分,比第三代EPYC7763的663分提升了123%的性能。

“鉴于第三代EPYC已经获得了服务器处理器市场中的性能领先地位,第四代EPYC相对第三代进一步倍增的性能,将进一步强化AMD在服务器领域的影响力。”Ram Peddibhotla信心满满地说。

简言之,Genoa是适用于所有通用计算的一款处理器,从虚拟到集成,从软件、网络,到基础测试、数据分析等,都提供高度融合的支持。

3.面向云原生应用的“Bergamo”

云原生,就是基于云平台定制开发的计算性能。Bergamo处理器提供了可扩展性、灵活性、抗压性、速度、可视化,支持建模、简化部署和管理。

Bergamo 处理器

通常情况下,一个大型传统的大型应用系统,开发周期长、投资成本高、应用时间久、迭代更新慢、运算的时间也很长。而基于云环境的应用程序是一次编写、随时随地运行。在云计算模式下,一个大的程序可以分解为成百上千个函数在运行,甚至毫秒之内就可以完成SOC上的计算,相应地,开发人员也可以快速地更改模块的不同部分,更新迭代方便。

大型应用程序需要借助大量缓存进行数据共享,而云计算则是另一个极端——由于函数之间的数据局部性很小,所以缓存并不能显示优势,也就是说,云环境下处理器的三级缓存重要性极度下滑,取而代之的是软件的兼容性:以科学的创新取代艰难的迁移。

EPYC 97X4系列(Bergamo)

EPYC 97X4系列三个版本:9754、9754S、9734,核心从112到128个,三级缓存均为256MB。其中9754S的 SMT可以配置,这是为了给客户提供更好的灵活性——当然,SMT打开后性能会更好。

数据显示,开启SMT配置,总体拥有成本可以节省约9%。

那为什么有些用户要把SMT关掉呢?

“这是因为他希望拿到一个单线程最高的性能。这种情况下,他才会去关掉SMT。当然,我们允许他关掉。” AMD公司副总裁Robert Hormuth解释说。

EPYC 9754 平均吞吐量性能提升2.9倍,比Ampere高出3.7倍

EPYC 9754为什么能适用于各种云原生工作负载?经过NGINX、Redis 、Cassandra-test、Memcached、FFmpeg、MySQL TPROC-C、Server-side Java Max等平台运行测试,EPYC 9754与Ampere Altra和英特尔至强8490相对比,平均吞吐量性能提升2.9倍,比擅长于云数据中心处理器的Ampere高出3.7倍。

如果要实现每秒处理3.75亿的实时需求,与128核的1P Ampere Altra相比,同核数的1P AMDEPYC 9754可以节省55%的服务器数量,年度节省39%的耗电量、39%的运营成本,最终减少19%的总体拥有成本。

4.加载3D V-Cache技术 的“Genoa-X”

加载了AMD 3D V-Cache技术的Genoa-X三款产品配置

Genoa-X是加载了3D V-Cache技术的第四代的EPYC处理器 ,它采用 5nm制程工艺节点、高性能“Zen 4”内核,高达1.1GB的三级缓存容量,以及AMD Infinity 、Guard安全性和丰富的解决方案生态系统,以世界上技术计算最高性能的x86服务器处理器支持有限元分析、结构分析、电子设计自动化、计算流体动力学。

“加载了AMD 3D V-Cache技术的Genoa-X包括三个产品,16核心的EPYC 9184X支持电子设计自动化相关的计算, 32核和96核的EPYC 9384X和EPYC 9684X主要支持计算流体动力学、有限元分析和结构分析。” AMD公司副总裁Robert Hormuth 介绍说。

采用AMD 3D V-Cache技术的第四代EPYC RTL验证速提高73%

同等环境下,运行SYNOPSYS VCS,采用AMD 3D V-Cache技术的第四代EPYC ,其RTL验证速度比没有采用AMD 3D V-Cache技术的第四代EPYC提高73%。

8节点集群可提供14节点的性能

OpenFOAM 超线性加速可扩展性将2个96核的AMD EPYC 9684X速度提升 13.9倍,意味着8节点集群可提供14节点的性能。

更少的服务器投资、更少的功耗与排放

如每天完成165000个Ansys Fluent模拟计算任务,需要采用英特尔可扩展Platinum 8462Y处理器的21台服务器。相比之下,采用AMD EPYC 9384处理器的服务器数量减少43%至12台,能耗降低38%,运营成本降低38%,每年二氧化碳减排44吨,三年TCO可降低39%。采用EPYC处理器,意味着更少的服务器投资、更少的能源与功耗,相应地,更少的二氧化碳排放。

第五代EPYC CPU,已经在路上

在 “数据中心和人工智能技术首映式(Data Center and Al Technology Premiere)”上,AMD还发布了AI相关其他几款产品,标志着AMD收购赛灵思的前瞻决策与两家公司的全面、快速融合。

总结第四代EPYC处理器的发展史后Ram Peddibhotla指出,AMD第四代EPYC 96X4系列(代号 Genoa),是世界上最好的数据中心通用计算CPU;而刚刚问世的第四代EPYC 97X4系列(代号Bergamo),是最佳云原生优化CPU;一同亮相、采用3D V-Cache技术的AMD 第四代EPYC 9004X 系列(代号 Genoa- x),则是最佳技术计算优化的CPU。

看来得出来,AMDEPYC处理器覆盖了大量的业务应用场景。

当面向电信和边缘端的Siena处理器强势面世的时候,AMD 第四代EPYC处理器产品家族将缓缓关上大门,而另一扇大门,第五代EPYC处理器(Turin)产品线,已经在徐徐打开。