还记得卡通片《怪物公司》吗,那些怪兽深夜从阴暗中爬出来吞噬孩子们的快乐。而性能一步步飞升的超级计算机,不也正如一群巨大的怪兽逐渐吞噬着这个星球上的能源吗?在这个人人都高喊"节能环保"的年代,不论他们实际出于何种目的,能源集约已经深入人心。而一直以来,HPC除了些许亮光之外,似乎仍浑然封闭。
本文写于本年度全球高性能计算TOP500发布之后。以我个人之见,向高性能计算为这个世界做出的贡献致敬,也试图对这个性能当道,Benchmark上位的领域进行一次逆动。无论如何,充当少数的、被专业人士斥做无知的不同意见者。并再次迎接HPC性能飞跃的到来,以及那些能耗怪兽的又一次粉墨登场。
困境与希望
笔者认为,真正实现绿色HPC仍然困难重重。主要有一下几点阻碍:首先,高性计算采购部门是花钱部门而不负责支付电费;其次,封闭的系统使得技术创新的推动力不足;第三,硬件更新周期时间长。
不过可喜的是,目前已经有越来越多的业内人关注HPC的能耗问题。这从近两年TOP500和国内TOP100的评选就可看出。可以想见,随着诸如Green500等以能耗为标尺的HPC评选的推动,还有针对高性能计算的虚拟化技术研究的演进,以及未来更具实际意义的,以系统持续应用性能为考量尺度的指标的出现,绿色节能必然会成为新一代高性能计算系统设计研发的焦点。
我尝试对最近三年的TOP500榜单中一些典型的高性能计算系统进行比较,可以看出能耗与计算能力的发展脉络。
x86处理器能耗控制更出色
传统意义上,高性能计算就是争夺的服务器集群,集群已经构建好,可以执行程序了,接下来需要了解这些程序的执行速度到底有多快,才用了著名的 LINPACK 基准测试,这个标准叱咤HPC几十年,尽管有很多人认为其无法完全考量一套HPC系统的全面指标,但仍然是HPC业界最重要的一项评估标准。除了HPC的自身特点之外,传统HPC一般只运行单一应用程序,这也是人们只重性能忽略其他的关键因素。
不过随着最近几届TOP500榜单的发布,发生着明显地变化,除了性能之外,HPC的整体系统性正在越来越受关注,TOP500的指标中也多了能耗这一项,而更有业界人士发起了GreenTOP500的评选。
与这些变化同时发生的,是x86架构系统在HPC TOP500中的份额逐年增加。以最新一期TOP500为例,基于英特尔架构的上榜系统已经达到406套,其中基于至强5500的上榜系统为184套,排名前十的上榜系统中有4套是基于英特尔处理器。显而易见,x86处理器虽然在性能上与RISC相比还有一定差距,但是其在程序运行的效能方面,优势明显大于RISC架构。
正如英特尔公司新任高性能计算业务总经理Rajeeb Hazra所说,以前HPC只运行单一应用程序,而现在越来越需要HPC同时运行多个应用程序。客户需要的不光是性能,更关心应用的兼容和效能。而在这方面,x86系统跨多个系统应用程序的能力非常强。以5500和5400对比,5500的核心数并没有增加,然而运行应用程序的性能却提升了3倍。有了这样的处理器支持,就可以为HPC用户提供更加多元化的服务,应该说,这是x86给高性能计算带来的最深刻变化。
总之,x86架构的核心优势未来会呈上升趋势在TOP的系统里,随着越大的系统服务于越多的应用程序,x86系统会成长得越来越快。
系统架构越新,效率越高
2008年6月第31届TOP500,排名第一的Roadrunner峰值性能达到1375.78TF,功耗为2345.50千瓦;2008年 11月的第32届TOP500,排名第一的Roadrunner峰值性能1456.70TF,功耗为2483.47千瓦;今年6月的第33届 TOP500,排名第一的Roadrunner峰值性1456.70,功耗为2483.47千瓦。
上述分析表明,系统越新,效率就越高,因为采用了新的节能技术,从而使功耗控制更出色。
英特尔钟最新一代至强处理器可谓是其中完美的一摆,仅从8核心16进程就可以看出Nehalem EX将是一个"强悍"的四路服务器平台–既拥有 Nehalem架构的高性能优势,又可以对付诸如虚拟化平台的多进程应用。而除了性能之外,在HPC方面,Nehalem最令人印象深刻的还是起应用程序能效方面。以5500和5400对比,5500的核心数并没有增加,然而运行应用程序的性能却提升了3 倍。有了这样的处理器支持,就可以为HPC用户提供更加多元化的服务,应该说,这是x86给高性能计算带来的最深刻变化。
其他系统介绍
SGI Altix ICE系列。2007年11月的第30届TOP500中,构建在美国新墨西哥州计算应用中心的SGI Altix ICE 8200以峰值性能172.03TF,功耗856.80千瓦排名第三;2008年6月第31届的榜单该系统数据为峰值性能和功耗没有变化;2008年11 月第32届和今年6月第33届,构建在美国爱姆斯研究中心的Pleaieds系统–SGI Altix ICE 8200以峰值性能608.83TF,功耗2090千瓦,分别位居第三和第四。
SGI Altix ICE的架构有些特殊,部分像集群,部分像MPP,据SGI自己说这会挖掘出系统的最大潜能,相当程度的提高HPC系统可靠性,并且提供更高的功耗效率。从历届榜单上看,这套系统能耗控制也还可以。
Cray XT系列。2007年6月的第29届TOP500中,Cray 搭建在美国橡树岭国家实验室的一套XT4/XT3,代号Jaguar,以峰值性能119.35TF,功耗618.57千瓦排名第二;2007年11月的第 30届TOP500中性能功耗与上届相同;2008年6月第31届TOP500,Jaguar峰值性能提升至260.20TF,提升一倍多,而功耗也提升一倍多,增至1580.70千瓦;2008年11月的第32届TOP500,XT5系统的Jaguar峰值性能骤然提升至1381.14TF,功耗也直线飙升至6950.60千瓦;6月最新一届数据基本相同。XT5系统是目前前十位中能耗最高的,这可能是由于XT5采用MPP(海量并行处理器)服务器和 XT5h或混合型服务器,并使用AMD的 "低端"四核芯片造成的。
以下是我收集的近年来主要HPC系统的能耗指标,仅供参考: