如果把AMD EPYC(霄龙)处理器评价为第十八届CCF全国高性能计算(HPC)学术年会上的一个热词,我觉得一点都不过分。
2022年5月30日超级计算机名单TOP 500发布,AMD的第三代EPYC处理器(代号米兰)及Instinct MI250X 加速卡因被全球最快、美国橡树岭国家实验室的E级超级计算机Frontier大量采用而名噪一时。时隔半年,该实验室专家Jack Dangarra教授现身上述学术年会, 详细展示 Frontier 的性能特色,再一次将EPYC处理器推上新的高度。
虽然在EPYC处理器全球超算TOP 500超级计算机中仅占19%市场份额,但5年来取得这样的规模已经让对手感受到了巨大的压力,而且,上月刚刚升级换代的EPYC的性能,也再度实现超越。
12月12日,AMD大中华区技术总监刘文卓在高性能计算大会上详细介绍了代号为Genoa(热那亚)的AMD第四代EPYC霄龙处理器的系列产品。
CPU的选择比以往更加关键
AMD EPYC处理器是服务器、数据中心的重要组成部件之一,是现代数据中心高性能算力的引擎。AMD为业界提供领先的服务器CPU EPYC系列产品、数据中心GPU加速器、AMD instinct产品、FPGA和自适应SOC ALVEO、Versal以及智能网卡PENSANDO和DPU等产品系列。
自从问世以来,EPYC处理器在市场上获得了稳步长足的进步,采用AMD EPYC处理器的云计算的算力以及全球IaaS的云实力同比增长都超过两倍以上。
在企业级解决方案中,EPYC处理器也获得了巨大的成功,同比去年有两倍的增长。在本地部署的数据中心中超过50%的成长。
刘文卓指出,现代数据中心主要有四大因素需要优先考虑:一是业务转型,也即上云或者自建数据中心;二是CAPEX/OPEX,前者是指服务器、网络等设备的一次性采购成本,后者则包括电费、机房租赁、人工维护等运营成本;三是可持续发展,即业务如何有效持续性的降本增效;四是安全性,保护数据的安全,包括运行期间传输、存储不被恶意崛起或篡改。
综上原因,CPU的选择比以往更加关键。
AMD第四代EPYC处理器的惊人性能
上面的图片就是AMD最新推出的第四代EPYC CPU的真实照片图。这颗CPU具有高达96个Zen 4 的计算核心,由最先进的5纳米制程工艺生产。
众所周知,CPU就是算力,核心越多算力越强,核心数多需要的内存带宽和容量,IO带宽和容量也要相应提升。因此EPYC CPU正式集成了12个DDR5内存通道,128个PCIe 5通道,并且增加了CXL内存拓展以及两倍的加密虚计数量。
来看看这颗处理器惊人的性能。
第四代EPYC CPU比上一代AMD代号为米兰的CPU在云计算和整形吞吐量方面提升一倍以上。对比市面上同类产品则高达三倍的性能提升。云服务提供商借助96核EPYC CPU获得每台服务器2.4倍的实例数。而最终客户每台虚机的整数性能比上一代还提升24%。
在云计算的能效方面,第四代EPYC CPU比市面上同类产品的性能功耗,性能功耗比提升2.6倍。
第四代CPU领先的云计算效能使得云计算提供商能够持续性的降本增效,提高企业的利润。
浮点性能是HPC高性能运算的重要指标。AMD第四代EPYC CPU的浮点性能比市场上同类产品提升2.5倍,比上一代米兰产品提升将近2.3倍。
2.5倍的性能提升,对于仿真应用等科学研究具有重大的推动作用。JAVA Avm性能是评估企业级应用的benchmark,在企业级应用上,第四代EPYC CPU也不遑多让,比上一代有将近一倍的提升,比市面上的同类产品具有将近三倍的性能提升。
AMD自从2017年回归数据中心,正式推出14纳米的Zen产品,EPYC CPU的路线图一直非常稳健。
自2019年推出革命性的7纳米基于Zen 2、代号为ROME(罗马)的第二代EPYC CPU后,AMD紧接着在2021年推出改良型的7纳米的基于Zen3、代号为米兰的CPU。在上个月的11月10日又隆重推出了第四代5纳米的CPU。明年AMD还将继续推出具有更高密度核心的Zen 4c的CPU以及具有3D V-cache 三倍高速缓存的Zen4 的CPU,代号为x。
Zen 4:第四代CPU最重要的基础构建
第四代CPU最重要的基础构建是Zen 4。Zen 4是AMD历史上也是当今IT最强的CPU核心。它支持具有AI和HPC加速的AVX 512指令,改进了缓存层次结构和分支预测。每个核心具有1M字节的L2缓存以及每个CCD具有32M字节的三级缓存。它采用业界领先的5纳米制程工艺,5纳米制程工艺采用第四代FinFET技术,增强的金属栈、专门为提供高性能计算进行优化。
第四代CPU提供不但高达96个核心,而且每个核心的性能(单线程性能)与第三代米兰CPU和业界同类产品相比也具有相当幅度的提升。在云计算、高性能计算和企业方面的计算具有领先的地位。IPC(每时钟周期运行的指令数)是评估一个核心性能的重要指标。Zen4核心在Zen3的基础上对2级缓存、执行引擎、分支预测Loadstore以及微架构方面进行了多项的调用,使得其IPC比上一代又提升了约14%。在性能功耗比方面,Zen4较Zen 3的核心在整形运算能力方面提升1.4倍,浮点运算能力提升1.7倍。使用AVX 512进行的AI运算较ZEN3提升2.7倍。
“这是核心与核心的比较,不是CPU之间的比较。”刘文卓解释说,“更多更快的核心需要更高速、更大的内存带宽和更多的IO带宽来辅助,需要更加安全的特性来保护数据和程序的安全。”
在IO方面,双路第四代EPYC CPU支持高达160个PCI e5的通道,其带宽是上一代PCI e4 的两倍,并且也支持CXL 1.1,实现突破性的内存拓展能力,并支持CXL 2.0的内存设备。同时第四代EPYC CPU采用12条DDR 5 4800内存,其内存通道比上一代提升2.3倍,并且在内存通道中内置了256位的AES-XTS加密引擎。
在安全方面,新的CPU提供两倍的SEV -SNP虚机加密技术,保护虚机免受SMT旁路攻击。
第四代EPYC CPU 9004全系列图
第四代EPYC CPU的正式名称为9004系列。AMD提供从16核到96核心的产品组合。左边的高核心数48 64 84 96的产品适合云计算和HPC应用,右边的低核心数的产品16核、24核、32核适用于主流企业级。
中间的则是高主频f系列,适合性能级的企业级运算,比如EDA软件就大量采用AMD的高主频系列产品。
截止到今年11月10日第四代EPYC发布的当天,该CPU总共取得了300多项的世界纪录。这些数据是AMD OEM、ODM等合作伙伴提交的,而非AMD自己做出来的。
AMD EPYC CPU是通用型的x86处理器,在大数据分析、基础架构、高性能工程计算以及企业应用的方方面面都有最佳的性能表现。
比如大数据分析方面,AMD取得了22项结构化数据和分析的世界纪录,以及28项非结构化数据分析数据和分析的世界纪录;基础架构设施方面,有23项云和虚拟化记录,以及15项整形运算性能和11项云虚拟机整形效率。在工程技术方面,有72项高性能计算应用的世界纪录,58项浮点性能记录以及12项浮点效能记录。商业应用则取得了8项ERP业务应用,48项JAVA应用以及18项能效。随着时间的推移,随着第四代EPYC CPU的广泛应用, 这个世界纪录还在不断增长之中。
全球所有知名的OEM、ODM以及云服务提供商都支持AMD第四代EPYC CPU的发布,其中包括国内的新华三、浪潮、联想,还有云提供商腾讯云、阿里云等,国内众多的OEM、ODM以及云厂商等合作伙伴也发布了或者即将发布基于第四代EPYC CPU的产品和实例。
生态方面,迄今为止支持AMD的软硬件合作伙伴不断增加。支持第四代EPYC CPU的生态厂商已经超过1000多家,其中还包括竞争友商的系列产品。
第四代EPYC CPU处理器家族
第四代EPYC CPU处理器不只是代号为Genoa的这个通用型产品,还有专门为云原生打造的高密度产品Bergamo,具有大容量的三级缓存的Genoa x和为智能边缘电信应用所打造的Siena的产品系列。
面向云原生的Bergamo明年上半年上市,主要是将Zen 4 核心替换为 Zen 4C 核心,有相同的核心架构和 L2 缓存,每个核心只有一半的 L3 缓存。Genoa x具有 AMD创新技术3D V-Cache,三级缓存是热那亚的三倍,更适用于计算流体动力学、EDA 和其他需要更多缓存的工作负载。Siena是单路产品,它在能效功耗比进行了优化,从内存到核心数量是兄弟产品的一半,以较低的功率和资本支出需求满足特定企业部署。
总而言,具有高达96核的 AMD EPYC CPU处理器,是专门为数据中心和HPC打造的高性能高性价比的CPU,是行业领先的数据中心的高性能处理器。
AMD下一代EPYC CPU代号为 “Turin”,预计将在 2024 年上半年推出。无疑,它有更多的系列和变体。
迄今为止,AMD的算力服务于数10亿人的日常生活,涵盖云、企业、高性能计算、5G通信基础设施、AI、自适应智能系统、游戏、仿真、视频以及各类智能的客户端设备。