我并不是世界上排名前500位最快的超级计算机强的顶礼膜拜者,正如大多数读者所了解的那样,这些排名是在Linpack(线性测试方法)基准程序的基础上确定的,而这种程序只能测量出一个系统怎样良好地进行一组特定的线性代数运算。另外还有,基准程序还能从理论上推断出一个给定的系统到底具有多少浮点性能。但是,由于大多数HPC应用程序的性能比Linpack复杂得多,因此,基准程序在确定计算机的真实性能时并不适用。
从排名中能看到最有价值的是,世界500强计算机到底能代表多少种技术、多少家公司,这也是它成为IT新闻主导的主要原因之一。当然,每个人都喜爱竞争。对于我来说,我就对有关排名的那些小道消息比较感兴趣。
例如,世界500强系统如何面对HPC挑战(HPCC)基准程序?HPCC包括七组代码,包括Linpack。利用HPCC来测量各种性能特性,包括存储器的带宽、系统的网络通信性能以及随机存储器更新的性能。正因如此,HPCC是为系统如何良好地完成各种实际应用提供了一种更为全面的考核方法。
目前,已有134种HPC系统可以运行在HPCC基准程序中,结果在HPCC网站中列出http://icl.cs.utk.edu/hpcc/hpcc_results.cgi。正如大家所猜测的,很多传统的群集系统在一些检测方面并没有取得多大的进展,尤其是处理器之间的通讯。高端IBM和Cray机器专用系统的相互连接后具有比自身更好的性能。两年前,在超级计算机研讨会和世界博览会上,HPPC的竞争使得在每种基准程序中名列前三甲的系统受益匪浅。通过很短的时间,IBM Blue Gene 和Cray XT3就一跃成为500强的榜首。
信息的另一个很有用的方面就是每瓦特米的性能。如果前500强的组织者要求指定系统使用的功率,那么只需要简单对给定的机器计算每瓦特的Linpack性能。HPCC也能做到这一点。Dr. Wu-chun Feng和Dr. Kirk W. Cameron在维吉尼亚建立的绿色(环保)500强网站,就是要通过鼓励建立HPC,提供这个信息来弥补不足。到目前为止,他们已经有八台计算机榜上有名。在112.24 megaflops/watt,IBM Blue Gene/L是目前最高能效的系统(从Linpack的角度来说)。要想看到能效方面的全部排名,请登陆网站http://www.green500.org/Lists.html。
由于接下来的几年时间里,petaflop系统将冲击这个市场,因此,计算机的功耗问题将显得更加突出。IBM声称新的Blue Gene/P体系机构功耗会达到350 megaflops/瓦(百万次浮点运算/秒/瓦),其大小比传统的集群系统还要优越。但是,Sun微系统提供的信息表明,今年晚些时候,他们准备在德克萨斯州高级计算机研发中心安装的500-tereaflop Ranger Constellation系统功耗可达到210 megaflops/瓦。根据Cray XT4的数据显示,该系统在不同配置情况下的功耗只有40~70 megaflops/瓦(我认为该数字只适用于双核Opteron配置)。
可能前500强列表中遗漏的最重要的信息就是这些系统在大的HPC界的前后关系。特别是,对于500强中所有的其他HPC系统来说,到底有多少台高性能的计算机,我把这个数字叫做“Sub500”。在过去的一年时间里,500台最快的计算机的性能合计已经几乎翻倍了,从2.79 petaflopss一跃到4.92 petaflops。因此,在Sub500中有多少HPC性能?而且更重要的是,在过去的一年时间里,Sub500的性能是不是也加倍了呢?
对于上个问题的答案可以告诉我们,HPC的使用是越来越广泛了还是只是更加深入了。如果答案是前者,那么就是说,如果去年Sub500用户的HPC性能至少翻倍了,那么真正的民主出现了。但是如果人们越来越富有了,那么高端HPC仍然占有主导地位。当然,还有一种更复杂的答案,就是这两种趋势一前一后相继出现。但是在给定的时间,肯定会有一种情况占有主导地位。那么,会是谁呢?
现在有一种观点,即大规模进行高性能计算机的生产在走下坡路。根据Tabor研究机构高级研究咨询人员Chris Willard的话来说就是,“低端产品的性能增长市场是由用户的数量和复杂性的增长来推动的。由于很多公司还在起步阶段,而且最近才从理论上进入计算机的生产阶段,因此成长的空间很大。与此相比,高端用户则是一个相当灵活的市场??这个世界还是愿意每年投入10亿美元用于高端的超级计算机,而且这种情况在过去的二、三十年里都不曾改变过。”
目前,对于整体的HPC性能是否在增长有些怀疑。在过去的几年时间里,高性能和高科技计算机的收入已超过了20%(而性价比还在不断提高)。而且如果你相信IDC的数据,这种增长实际上来源于低端市场,根据中小型群集系统的需要来推动的。但是进行这种分析时对数据的标准采集方法可能也会对低端市场更有利。例如,一些经销商只报告计算机的销售量,而不是集团销售量或系统销售量。他们没有办法说清产品售出后有多少个是作为终端配置的。他们可能将其作为单机服务器或将其结合到更大的系统中。对于观察者来说,他们看上去更像是终端系统。
即使相信Sub500会出现市场预期的增长势头,我也不能确定性能容量的增长能跟上发展的模式。遗憾的是,数量的细目分类很难得到。正如上面提到的,即使是从数据采集方法来看就有它的局限性。而且提供过去几年时间里所有的HPC系统的列表和计算机终端的出货量、计算每个系统的容量,然后确定哪台机器还在使用、哪台已经报废,这些事情几乎是不可能的。所以,我仍然持以观望的态度。
如果进行大规模的计算机的生产是正确的,那么大的系统的前景将会很可观。如果这种假设成立,那么计算机的功耗就会与更大的、为数更少的机器相结合,而且可以通过一个比较实用的方式进入大多数的计算机。有些人甚至认为,对于整个世界来说,只需要几台计算机就足够了。如果将来真的演变成这样,那么从某个角度来看,世界500强的名单将会变得寥寥无几。