IT号外之HPC精品导购:超算选型必备六招

从最近两周发布的案例分享文章和通俗易懂的漫画中,想必大家已经体会到了英特尔至强5500对于HPC用户的实际价值。

现在,我们的“IT号外”将进入对用户更具现实指导意义的篇章,本文就将探讨HPC用户在服务器硬件选型中需要重点关注的方面,并对基于至强5500的相关产品进行一番介绍和点评。

众所周知,选购HPC系统产品,绝不可能像购买一台PC,或是一台普通的服务器那样轻松,鉴于HPC系统高昂的投资,HPC用户在选购其硬件平台时,通常都会先对待选产品进行认真且详细的测试与评估,并以此为基础做出决策。对此,我们建议用户在这一环节中要尽量确定适于目标应用,也就是自己真实应用软件的测试指标和方法,在评估中则要从CPU、内存带宽及其最佳配置、内存和QPI的参数配合选择、存储子系统及节点间互联等对HPC系统性能至关重要的几个方面来考虑,以下就是我们与之相关的六顶主要建议,谨供大家参考:

1.HPC选型测试不要只看Linpack值

在确定HPC待购产品的测试指标和方法时,用户一定要切记不要太看重Linpack值。虽然HPC的全球TOP500排行榜和中国TOP100排行榜都是以它为标准对HPC系统进行排名,但这并不意味着它可作为具体用户评估和测试HPC系统的惟一标准。由于Linpack只是一个出好的压力测试软件,可通过简单的求解线性方程组,能够给出足够的压力,来测试高性能计算机系统的浮点性能和扩展性,还可用来对机器进行“体检”——烤机、查错,并在测试和优化Linpack过程中也会发现一些系统Bug。但它却无法反映出HPC系统的实际应用性能。

例如,3.2GHz的至强5482和新一代的2.93GHz至强5570,由于后者的时钟频率略低,因此在Linpack测试中并不占优,但对于石油油藏模拟、气象等对内存较敏感的应用来说,由于至强5570采用了QPI和集成内存控制器,能提供更大的内存容量和内存带宽,总体应用性能却有2-3倍的提升,而这是Linapck测试所无法体现的,因此用户如只凭Linpack来选型,就难免会误入歧途。

从更加科学的角度来说,用户在对HPC系统进行选型测试时,应使用贴近自身实际应用特征的工具和方法,从内存带宽占用、内存使用量、CPU利用率、存储I/O、网络带宽等多个指标进行应用特征分析。

2.从应用出发实现系统最优化均衡配置

目前的HPC应用,一般最倚重的指标有三,即CPU浮点计算能力、内存带宽及容量和I/O的带宽,一般来说,它们都会在兼顾三者的同时偏重其中某一项,例如石油行业HPC系统上运行的地震资料处理软件是浮点计算密集型应用,而油藏模拟类应用软件则对内存带宽要求较高,因此如能选到一个在这三方面均有出色表现的平台,那就是最为理想的结果了。

在选择了一个均衡平台的基础上,用户还要在采购HPC系统前再对自己的主要应用软件的特性进行一些分析,看看自己的应用对硬件平台那一项性能或能力最为偏重,最好是确定一个适合于自己应用的测试指标,借试用厂商新服务器产品的机会测试一下,以求的配置上进行精准的调整,达到最合理或优化的效果。

比如,我们将HPC选型按应用分成四个类型:一类是只跑一种应用,如气象领域的HPC系统,这时最关键的就是要对应用进行专门调优,选择最匹配的机器;第二种是运行某一类型的应用,英特尔就曾对12种生命科学软件的应用特征进行了分析,找出其共同的特点和性能瓶颈,然后给出了对应的系统配置,以帮助OEM厂商和用户在进行系统设计和选型时有更加科学的参考;第三种则是运行几类不同的应用,如由多个院系共享的校级计算中心,这时同样需要对多种应用软件的应用特征进行分析,找到尽可能适合这几种应用的系统配置;第四种是完全对外提供服务的公共计算中心,要求什么应用都可以运行,这需要进行综合的性能测试,以找到一个平衡的通用系统。

3.尽量实现单节点性能最大化

具体到HPC系统应该选择什么样的CPU方面,我们建议用户可根据所要达到的峰值计算能力选择相应档次的CPU,通常主流HPC应用在至强5500系列里可选5520、5550和5570等几个型号,但需要注意的是CPU在运行实际应用时,其能否发挥峰值计算能力还要考虑内存带宽的限制。

在此基础上,我们还是建议大家要尽量实现单节点性能最大化,这意味着我们应该根据需求,尽量选择较为高端的至强5500处理器,表面上这确实是会增加一些硬件采购成本,但是它们可以让单个节点的计算性能更强,从而可以减少节点的总数量,大大节省在节点间互联、软件授权、系统运维上的成本,还能够让系统的计算效率更高。英特尔将于明年推出的Nehalem-EX多路处理器就将让四路、八路以上的“胖节点”构建起来更加容易,用户届时可以根据应用来实现“胖节点”、“瘦节点”的混合搭配。

要实现单节点性能的最大化,在选择内存系统时,同时需要注意这样一些指标和关系:如内存和QPI之间的配合,每通道的内存插座数量。比如,1333MHz的内存,需要QPI带宽达到6.4T/s为最佳配置,而1066MHz则可和5.87T/s的QPI配置配合;每个内存通道的DIMM越少越好,已避免资源竞争和峰值内存带宽限制。

4.互联选择,要在端口数量和价格之间平衡

千兆以太网、Infiniband都是目前HPC系统内部主要的互联网络标准。随着Infiniband的普及,主流HPC集群的节点间互联基本都采用DDR 2x 或QDR 4x 的Infiniband交换机和接口。由于Infiniband交换机的配置和价格随支持端口数的增加有较大变化,所以用户可以通过设计合理的网络拓扑来减少投资,同时可通过采用较高主频的CPU来增加单节点性能,减少集群总节点数量。

5.考虑用固态硬盘突破存储I/O瓶颈

从全球和部分国内HPC用户的反馈来看,无论是对HPC领域还是一般数据中心用户来说,使用SSD(固态硬盘)和SSD阵列的服务器设计来突破存储I/O瓶颈都已成为一种趋势。在这方面,较为流行的做法是可以使用SSD作为本地快速、临时的存储池,加速对本地盘的临时快速读写。

6.待选系统是否能够满足限定的供电和散热条件

虽然HPC用户和潜在的用户对于系统的总功耗还不是特别敏感,但其技术人员还是要保证待选产品的功耗和散热能够满足既有条件的限制,尤其是那些升级HPC系统时可能要延用原有机房的用户。而对于那些新建HPC系统,同时也将为该系统新建其周边基础设施的用户来说,他们就应该在设定系统性能目标的同时也确定其功耗和散热的目标值,并以此为基准设计和配置其机房、供电和散热设备。当然,这个目标值是必须要兼顾到未来系统升级的需求,拥有一定弹性的。

以上这六条建议,只是我们对HPC系统采购过程中一些关键环节的浅见,事实上,用户考虑的方面还远远不限于此。我们想强调的,就是用户不论做出什么样的决策,其基础都应该是从实际应用和实际需求出发。接下来,我们想再介绍六款基于英特尔至强5500处理器的、适用于HPC系统的服务器精品,希望能为用户在具体产品的选择上提供一些帮助。

1、IBM HS22刀片,领军网游行业HPC应用

提到IBM的高性能计算产品,就不得不提到HS22这款刀片服务器。在今年最新的中国TOP100排行榜上,前十名中有六台机器清一色使用的都是这款刀片服务器。他们也都是网络游戏运营商,因为网络游戏对高性能计算的需求而组建了超级计算机——不约而同选用IBM HS22的原因又是什么呢?

简单来说,HS22与上一代刀片HS21比较起来,其处理器更新换代为最新的至强5500系列,计算性能相对HS21有2倍以上的提升(得益于至强5500的QPI总线和集成的内存控制器)。另一方面,我们认为HS22刀片拥有多达4组10Gb以太网和总共8个I/O端口才是其优势所在。其8个万兆交换所带来的负载均衡极大的满足了高性能计算的延迟问题。这也是众多网络游戏公司选择它的原因之一。此外,HS22还凭借至强5500出色的功耗控制,在效能比上优势明显,对运营成本很敏感的网游公司自然也会考虑这个因素。

2、轻巧而强大,戴尔R410专为HPC而生

戴尔的产品一直以来都有其独到之处,其R410就凭借至强5500处理器的超强性能和戴尔本身对系统带宽的良好把控——DDR3内存的采用及可选的多种网络接入方式,使得其性能相比上一代产品提升了80%。另一方面,预装的戴尔管理控制台(DMC)和戴尔生命周期管理器则可帮助管理者简化原先繁琐的管理流程。

戴尔方面表示,客户在构建HPC基础架构时的需求除了性能外,主要集中在以下几个方面:简易性、成本和可扩展性。戴尔将最简单的1U机架服务器做成HPC节点,一方面就是从管理和维护的简易性去考虑,另一方面是从成本来考虑的——相比刀片要便宜很多。而相比刀片服务器的高密度环境来说,R410拥有者更灵活的扩展空间,单位功耗上也要比刀片低得多。

3、惠普DL360 G6,强调容错与冗余备份

如果说至强5500是为HPC而生,那么惠普的HP DL360 G6就是为至强5500而设计的一款集高密度计算、基本容错和HP Insight Control于一体的1U机架服务器。惠普用18根内存插槽配合双路至强5500处理器,最多可以打造一个144GB寄存式内存的强大计算环境。网络方面惠普采用了带TCP/IP卸载引擎的双端口多功能千兆网卡,与其智能阵列配合,使得DL360 G6在硬盘I/O和网络I/O上都不会出现瓶颈。

在做科学计算或复杂的工程运算时,用户通常都难以承受系统在运算过程中出错——那意味着前功尽弃。HP DL360 G6以冗余风扇+冗余电源的双冗余备份设计以及智能阵列RAID控制器的便携式电池允许将高速缓存写入另一台服务器中做冗余备份,大大降低了在高性能计算中因为一个节点宕机造成的损失。

4、五大优势,曙光I610r-G可担大任

曙光I610r-G相比上一代产品主要在处理器、芯片组和内存方面有所升级,因而上市之初就被认为是未来云计算、高性能计算的节点组成部分。其五大优势主要是:“高性能”、“高可靠性”、“高可扩展性”、“高可管理性”以及“高性价比”。

高性能自然毋庸置疑,双路至强5500保证了1U机架内的出色计算密度,而12根内存槽也保证了最大96GB的海量内存配置。高可靠性方面,I610r-G主要拥有BIOS保护恢复、网卡自动切换、电源自检报警等功能,使得系统从底层BIOS到上层网络任何一方面出现问题,都可以及时转移工作负载,不会影响使用。扩展性和管理性方面,I610r-G可以扩展1个半高的PCI-E x16的扩展卡和一个全高的PCI-E x8的扩展卡,并且由于集成了曙光智能硬件监控系统,其内部电流、风扇转速等都可以得到监控和调整,方便了管理员在高性能计算集群中对某一节点的单独调整。

5、挖掘联想深腾7000背后的节点信息

今年国内的TOP100排行榜上,联想深腾7000系统以145.2万亿次的计算速度排名第三。但是由于联想的策略和深腾7000在中科院超算中心的应用较机密。我们并不能在联想官方网站上看到有关深腾7000节点的有关信息。不过我们知道,深腾7000的主要计算节点是深腾B714R刀片服务器,7U高度的刀片机箱内部可以插14片双路计算刀片,也就是一个42U的标准机柜内,最多可以装84个计算刀片,配备接近672个计算核心。

据联想展示的资料表示,深腾B714R刀片服务器完全可以支持双路至强5500处理器,尽管深腾7000超级计算机中的节点采用了至强5400处理器——当时还未推出至强5500。除了对最新处理器的支持外,深腾B714R还拥有转换效率达93%的高效电源,且所有模块全部支持热插拔,关键部件,如网络模块、电源模块也配备了冗余。

6、浪潮天梭TS30000 ,实力胜于一切

浪潮的天梭TS30000一经推出就先后 6次打破SPECjAppServer应用性能测试、SPECpower节能测试、TPC-E数据库性能测试等全球权威测试纪录。这也是在早先使用至强5400处理器时的情况,现在的TS30000已经可以支持最新的至强5500处理器,其高速QPI互联完全消除了北桥和处理器之间的带宽瓶颈,浪潮认为其系统带宽至少提高了50%以上。

值得一提的是,TS30000去年还通过了OVM测试,其整个测试是对包含数据库、操作系统、服务器、存储产品在内的综合平台进行测试,强调了系统性、严酷性和高仿真性,而浪潮TS30000划分了8个虚拟机顺利通过了这些测试,等同于是经受住了8次Oracle VC的测试考验。

以上6款HPC精品,均可发挥英特尔至强5500的强大性能、智能计算功能和出色的能效,同时,得益于开放的架构,这款处理器也能为其他众多品牌及型号的HPC系统注入充沛的活力,我们相信,这些产品将为HPC用户及潜在用户带来充裕的选择空间,用户也完全可以根据自己的需求,在它们之中挑选到最合适自己的产品。

在下一篇“IT号外之HPC应用指南”中,我们就将告别选购环节,切入到应用阶段,为用户如何用好基于至强5500平台的HPC系统,充分挖掘它们的潜力献计献策,这篇文章将于12月29日发布,敬请留意。