DoSERV分析 11月6日国际报道:高性能计算(HPC)系统一直是新闻媒体关注的话题,特别是半年一度的高性能计算500强超级计算机排行榜的发布。1993年第一次排行榜名列榜首的是拥有1024台处理器和60千兆计算能力的思维机CM-5。而如今拥有288 teraflop计算能力的是高性能计算领域中的领跑者IBM公司的"蓝色基因"/L(Blue Gene/L)。性能相当于提高了45000倍。目前有几家厂商都在打算在年内进入petaflop级别运算的领域。
这个标题并不意味着什么,但是他非常的重要:高性能计算价格的下降为它拓宽了用户的使用范围。"在低端市场,我们也在寻求中小企业用户的支持"位于圣地亚哥的Tabor Communications集团旗下的Tabor Research研究机构的资深研究顾问克里斯托弗.威拉德说:"入门级系统在这十年里一直是市场上的主流"。在这个趋势下很多因素都在发生着变化。一方面,硬件价格的下降使得那些财富500强和国家研究机构之外的用户也能够承受了。另一方面,市场的重点已经从硬件转移到软件,Linux集群已经逐步取代了单块集成电路的超级计算机设计模式。
"我们致力于解决如何设计硬件的问题来使得系统能一起工作,我们也思索如何设计软件的问题以便计算机都一起工作"。唐纳德.贝克这样说到。唐纳德.贝克是90年代中期任职于美国国家航空和宇宙航行局戈达德太空飞行中心,是世界上第一个Linux集群的创建者,目前是位于旧金山的基于Linux的服务器和集群设备厂商企鹅计算公司(Penguin Computing)的技术总监。
事实上,Linux集群无论对于高端市场还是低端市场都是一场革命。2007年6月发布的高性能计算500强排行榜中373家集群厂商赫然在列。现在每个人都可以在家里在不使用高性能计算的情况下创建一个Beowulf集群。不过这个趋势可能已经走到了尽头。威拉德说,集群已经开始逐渐接近高端的极限。将来提升的空间将主要在一些特定的领域,使用为特定目的设计的处理器来减少主中央处理器的常规运算法则。一些厂商已经开始这样做了。
接下来让我们一起关注高性能计算领域目前的发展现状,来看看这些生产厂家们是如何来提升他们系统的性能的。
Cray公司
位于美国华盛顿州西雅图市的Cray公司自从2000年从美国高性能计算领先供应商SGI分离出来以后,目前正处于恢复期。在高性能计算500强排行榜上它有11个系统位列其中,包括No. 2和No. 3 spots。美国橡树岭国家实验室(Oak Ridge National Laboratory)的美洲虎系统是Cray XT3和XT4系统的完美结合,它使用11,706个AMD公司皓龙处理器计算节点,46 TB内存,比119 teraflops的性能还要卓越。美国橡树岭国家实验室计划在今年底使系统速度得到双倍提升,方法就是将系统升级到双核芯片,双倍内存并在计算节点上迁移到Linux拆分版上。
"Cray XT4系统是非常完美的系统,它能给我们的应用软件提供最为卓越的整体工作性能"美国橡树岭国家实验室项目负责人亚瑟.贝莱德说"这个系统还具有很高的量测性并且易于升级"。
Cray公司的XMT超级计算机平台是大体积多线程处理系统能处理超过一百万个并行处理线程。Cray XT4超级计算机是大体积并行多处理系统,采用AMD的HyperTransport技术和皓龙处理器连同Cray公司的三维互联网络。它能测量超过1个的petaflop级别运算。Cray X1E超级计算机使用的是矢量处理器。
根据Cray公司总裁Pete Ungaro的说法,Cray公司计划在年底前生产出另外一款主流高性能计算产品。
IBM公司
IBM公司继续雄踞高性能计算领域的霸主地位。在高性能计算500强排行榜上排名前10位的系统中IBM就占据六席,前100位的排名中IBM就有46套系统。最大的超级计算机就是美国劳伦斯利沃莫尔国家实验室的"蓝色基因"/L(Blue Gene/L)计算机,它每秒运算速度超过28o.6万亿次。今年六月,IBM公司推出了Blue Gene/P平台的改进型,它能提升到3个petaflops。
"Blue Gene/P与它的上一代Blue Gene/L相比,性能几乎提高了三倍。是目前世界上最快的超级计算机。也在保持"能量使用最有效和空间使用最节省的计算机"称号"IBM公司超级计算机部门副总裁戴维.特瑞克这样说道。
象它的前一代一样,新的超级计算机使用的也是IBM公司的POWER大型机处理器。不同之处在于Blue Gene/P使用的是四核模式超越了"蓝色基因"/L(Blue Gene/L)的双核模式。德国的马科斯.普朗克研究院在今年9月安装了世界上第一台Blue Gene/P超级计算机。但是由于只有8,192个处理器,新的系统将不能设置任何记录。阿贡国家实验室(Argonne National Laboratory)今年年底也在安装四核超级计算机,不过只能运行111 teraflops,因此它仍然位列美国劳伦斯利沃莫尔国家实验室的Blue Gene/L计算机之下。
企鹅计算公司(Penguin Computing)
企鹅计算公司(Penguin Computing)是专门致力于为高端及低端高性能计算领域制造高性能计算集群,服务器和存储设备的生产厂商。它hai 出品了Scyld集群管理软件。今年1月,企鹅计算公司(Penguin Computing)发布了一款专为低成本高性能计算集群设计的服务器。Altus 600服务器采用两台AMD公司的皓龙处理器,支持64GB随机存储器,双核处理器配置。市场定价为1,499美元。这款服务器去除了高性能计算中不需要的特性,使它比通用目的的服务器更有效率。
SGI公司
SGI公司的高性能计算机结合了它使用现场可编程闸阵列(FPGA)的RASC技术,能使用户对系统进行自定义从而使特别运算法则达到最优。这项技术的应用大大减少了计算机的处理时间。今年六月,SGI公司推出了它专为高性能计算设计的Altix ICE刀片式计算平台。
"目前公司的主要任务是处理更加复杂的计算问题,随着用于管理和运营的数据量的日益增长,对于开发者而言压力也是与日俱增"SGI公司程序开发及战略客户总监Joe Mansour这样说道"解决这个问题的一种途径就是创建大型集群,但是这种方法会导致无法预料和难以处理的各项费用,比如经营支出,空间管理和能量消耗等等"。
SGI公司的Altix ICE平台从另外一个角度来说,也是特别针对高性能计算应用软件而设计。它具有无线缆的刀片机箱( IRU )设计,热插拔电源和整套高性能互联架构。这种基础架构在切断电源和热力的情况下,使更快的运行速度和更高的刀片密度成为可能。Altix ICE平台还包含了SGI公司新推出的水冷却通道设计。
SGI公司通通过这一最新型系统使绿色高性能计算成为现实,她不仅能够帮助用户征服高额的电力和制冷花费,同时通过自己优秀的制冷来确保新平台的最大使用期限。Joe Mansour这样说道。
SUN微系统公司
SUN微系统公司推出的是使用x86或者SPARC处理器,运行Linux操作系统或者Solaris操作系统的刀片高性能计算集群。今年六月,SUN微系统公司宣布推出其星群系统(Constellation System)超级计算机。这个系统是SUN微系统公司与位于奥斯丁市的德克萨斯大学共同合作开发的,使用的是Solaris 10操作系统。德克萨斯高兴计算中心正在建立一个超过500千兆兆字节的星群系统(Constellation System)超级计算机。这个系统配置是123TB随机存储器和1.7PB原始数据磁盘存储器。SUN微系统公司计划今年12月投入生产。
SUN微系统公司一直活跃在集群领域的前沿并不断进步。今年九月,公司获取了Cluster File Systems大部分的知识产权,包括Lustre File System。Lustre File System是一个针对大规模计算集群设计的文件系统,包括在德克萨斯建立的星群系统(Constellation System)超级计算机。