本文作者:Steven Collins,英特尔数据中心性能总监
传统观念通常认为”越多越好”——更多时间、更多金钱,在高速公路上行驶时发动机马力更大——这些都是人们喜闻乐见的。但重要的是,要从整体角度来判断”更多”是否总是意味着”最好”。
数据中心工作人员和研究人员,特别是那些从事高性能计算(HPC)的人员,对技术的要求最高。对于他们而言,可支配的性能越高,解决世界上最严峻的那些挑战——天气模拟、药物发明,再到提高安全性——时就能加快探索发现的过程。
正如增加开会人数并不就一定意味着提高工作效率一样,”更多的处理器核心”也并不一定能保证”更高的性能”。性能涉及很多因素,而不仅仅是一个单独的向量。更多处理器核心可以增加计算能力,但是整体系统或工作负载性能还取决于其它因素,包括:
· 每个处理器核心的性能
· 利用特定指令进行软件优化
· 确保向核心提供反馈的内存带宽
· 部署集群级扩展
针对高性能计算而优化的性能
为了满足高性能计算永无止境的需求以及对更高应用性能的需求,英特尔于2019年4月推出英特尔至强铂金9200处理器系列。至强铂金9200主要针对要求最严苛的计算和内存带宽负载。使用高性能至强可扩展核心,它不仅通过两倍的核心数量提高了计算密度,而且使内存带宽增加了一倍1,进而可以让几乎所有的高性能计算软件都获得性能提升。英特尔至强铂金9200处理器拥有最高的两路每架机的基于英特尔架构的每秒浮点运算次数,以及所有英特尔至强平台中最高的DDR4本地带宽。至强铂金9282在现实世界广泛应用的高性能计算工作负载上提供业界领先的性能。
简单回顾下,至强铂金9200在一个封装中包含两个至强裸片,每个插槽有4个UPI,以确保2S系统中任意两个裸片之间只有一个跃点。同时,至强铂金9200提供多个SKU,每处理器核数从32核到56核不等,,散热设计功耗范围也跨越250W-400W。每个处理器有12个DDR4内存通道。此外,至强铂金9200是集成解决方案的一部分,能够支持英特尔服务器系统S9200WK数据中心模块的高性能计算。这能够让系统提供商轻松为终端客户配置一个定制解决方案,并且尽可能把采用新处理器的工作量降至最低。
高性能计算涉及领域广泛,根据工作负载有不同的计算需求。在制造业、生命科学、金融服务和地球科学等领先的现实世界高性能计算领域中,56核至强铂金9282处理器的性能表现比AMD Rome 架构64核处理器优异8%-84%(几何平均值高31%)。
以上展示的某些应用程序和结果是几个特定工作负载的几何平均值,所有这些负载都具有不同的特性和敏感性。深入了解这些工作负载的细节可以了解更多性能。例如,至强铂金9282在14个ANSYS Fluent负载上比AMD Rome7742领先13%。在14个不同的计算流体动力学模拟上,至强处理器的领先优势从低于几何平均值2%到高于平均值36%不等。
特定应用的性能对不同的属性非常敏感。例如,AVX-512是对英特尔指令集架构(ISA)的512位扩展,可用于至强铂金9200以及其它英特尔至强可扩展处理器。AVX-512增加了矢量宽度,使应用在每个时间周期可以进行更多的浮点运算。许多诸如VASP、NAMD、GROMACS、LAMMPS和FSI的HPC应用充分利用AVX-512,并获得明显的性能提升。一部分HPC应用受计算能力限制,一部分HPC应用受内存限制,还有一些在这两方面都会受限。面对现有瓶颈,单纯提高算力或内存带宽可能无法带来更高性能。至强铂金9200不仅通过更多内核提高了计算能力,还通过更多通道增加了内存带宽,并且纳入AVX-512扩展,为软件开发者带来便利。1
以更低TCO获得更高性能
更高的应用性能自然具备更高的价值,但为高性能所花费的成本也不容忽视。集群级总体拥有成本(TCO)是一个由多个元素组成的函数,其中涉及每个节点的性能,完成一项工作所需的节点数,连接节点的结构成本、交换机成本及布线成本,含空间和电力等的运营成本,以及软件。
通常来看,较高的节点性能会使总体拥有成本更低,这是因为达到固定性能水平所需的节点数更少。随着至强铂金 9200性能提高,所需的节点更少,从而降低了节点购买成本,也降低了架构、交换和布线成本。至强铂金9200系列的散热设计功耗(250W-400W)比AMD Rome7742处理器(225W)更高,确实会更耗电,提高电力成本,但是这些成本能被更少的节点数量需求所抵消。对于任何高性能计算用户来说,总体拥有成本都是一个复杂的问题,通常会因特定的应用、基础设施和成本结构而不同。就像性能一样,我们认为,必须以性能作为主要驱动因素,对总体拥有成本进行整体评估。
选择合适的处理器为高性能计算系统提供动力,需要考虑许多因素。虽然增加处理器内核数量可能提高某些应用的计算能力,但是整体性能和总体拥有成本是由多个属性决定的。更多的处理器核心并不总能带来更高的性能和更好的总体拥有成本。几十年来,英特尔始终与高性能计算生态合作伙伴密切合作,以确保其拥有合适的平台,能够最大化满足系统需求。放眼全球最强大的500强,其中使用英特尔处理器系统的数量就可以清晰印证这一事实。
行业应用情况
客户之所以选择英特尔便在于至强平台所提供的巨大价值,英特尔至强铂金9200也不例外。生态系统合作伙伴包括源讯、HPE/Cray、联想、浪潮、曙光、新华三和Penguin Computing。HPE最近发布了采用英特尔至强铂金9200处理器的Apollo 20服务器,该处理器主要针对数据密集型行业,包括石油天然气、金融、制造和生命科学。Penguin Computing目前正在劳伦斯利弗莫尔国家实验室构建一个基于至强铂金9200的系统,我可以高兴地告诉大家,该系统将在2019年超级计算机大会(SC’19)上亮相;HLRN(德国北部超级计算联盟)也在今年4月宣布 ,它们已经为其下一代超级计算机选定至强铂金9200,以期显著提高计算能力和效率。