能效 千万亿次 TOP500最新看点折射HPC发展趋势

服务器在线6月19日报道:昨天,最新一期(第31届)超级计算TOP500排行榜正式发布,IBM新近研发的超级计算机Roadrunner以1026万亿次浮点运算超越蓝色基因/L位居榜首。蓝色基因 BlueGene/L和BlueGene/P分别位列第二、第三,排名四、五位的机器为Sun和CRAY公司的超级计算机,峰值运算能力分别为每秒326万亿次和每秒205万亿次。

突破千万亿次

Roadrunner是IBM为美国能源部洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)开发的新一代超级计算机,其系统基于IBM QS22刀片服务器,处理器为CELL的改进版。

Roadrunner采用了一系列专门针对游戏和商业的技术,是全球第一台采用混合架构的超级计算机,包括用于PlayStation 3游戏机的Cell处理器和AMD 双核皓龙处理器,运行红帽Linux操作系统。Roadrunner拥有130536个计算核心,包括12960颗Cell引擎的116640个PPE和SPE核心,以及6948颗双核AMD Opteron处理器。

目前,众多厂商诸如IBM、英特尔和微软等都在大力研发千万亿次计算产品。我国也宣布在"十一五"期间将研制千万亿次高性能计算机系统,中科院计算所系统结构研究部主任,研究员孙凝晖指出,研制千万亿次超级计算机对于国家发展有三层重大意义,首先是国家安全,从美国以往的HPC计划来看,美国研制超级计算机的首要任务是为了解决国家安全问题,而此次Roadrunner就是由美国能源部(Department of Energy)国家核能安全管理部(National Nuclear Security Administration,NNSA)委托IBM打造,主要用来确保美国核能武器储存量的安全及可靠性。第二是加快科学研究,像日本Riken高性能计算中心和NEC针对专用领域的MDGRAPE-3,用于分析蛋白质分子。第三则是经济发展的需要,这也是我国发展千万亿次超级计算机的主要目的,在未来的网格环境中,象公用计算(Utility Computing)将是主要计算模式,千万亿次机将这种环境中发挥作用。他还透露,中科院计算所正在研究千万亿次机的全新的体系结构–超并行(HPP,Hyper Parallel Processing)架构–一种具有全局地址空间和三级并行的分布式系统。而此次IBM成功发布千万亿次超级计算机,具有很好的借鉴意义。

效能水平提升

记者了解到,在此次榜单中第一次加入了节能效率统计。主要是看该系统在运行一个典型HPC应用负载时的情况,而并没有考虑到外部制冷、磁盘、以及其他外部环境带来的能耗影响。通过这样的统计显示,进入TOP500前十的计算机中,平均能耗(Power consumption)为1.32 Mwatt,平均能效(power efficiency)为248 Mflop/s/Watt。前50名中,平均能耗(Power consumption)为908 Kwatt,平均能效(power efficiency)为193 Mflop/s/Watt。

具体到产品,Roadrunner尽管运算速度最快,但其能效亦十分可观,资料显示,IBM QS22 Cell 处理器能效比达488 Mflop/s/Watt。基于英特尔的Harpertown 四核刀片系统也表现出色,IBM BladeCenter HS21平均能效(power efficiency)为265 Mflop/s/Watt;SGI Altix ICE 8200EX Xeon nodes (E5472)为240 Mflop/s/Watt;惠普Cluster Platform 3000 BL2x220为227 Mflop/s/Watt。这些系统的能效比都已超过了BlueGene/L(210)Mflop/s/Watt。

记者查询了上一届的个主要系统的情况,发现新发布榜单中的系统能耗比以前降低了近10%,能效也有大幅提升。原因是新技术的应用带来了更低的能耗,而在榜单中那些新旧技术混合的系统指标则大都低于平均能效标准。因此,在今后的计算技术发展趋势中,低能耗应该会成为最重要的衡量标准。

异构计算(heterogeneous computing)

异构计算是近年HPC领域与多核一起崛起的新趋势,其已经在国际高性能计算领域掀起了又一阵热潮,它被公认为提高HPC性能的有效手段。此次Roadrunner首次结合传统的超级计算机处理器以及专为Sony PS3所设计的Cell 芯片,这也是IBM首次将异构计算引入其超级计算机中。

Roadrunner使用的是IBM更新架构的PowerXCell 8i,使其整合了多核以及异构计算两大特点,提供更强的处理性能,更重要的是,其更新后的SPE核心包括全64位浮点运算单元,这也是Roadrunner处理能力能够超过1000 teraflops的主要原因。

多核大行其道

在处理器方面,应用四核处理器的系统已经达到283台,双核系统有203台,而单核系统则逐渐淡出,只有11台。这说明高性能计算正在朝着并行多核快速发展。

在榜单中,有374台超级计算机采用了英特尔处理器,所占比例为74.8%,比半年前增加了4%。

此外,有61台采用IBM Power处理器,所占比例为13.6%;高于6个月之前的56款,所占比例12.2%。56台采用AMD皓龙处理器,所占比例为11.2%,低于6个月之前的78款。

在厂商方面,有210台超级计算机来自于IBM,所占比例为42%。183台来自惠普,所占比例为36.6%。戴尔、SGI和Gray所占比例分别为5.4%、4.4%和3.2%。

区域格局 中国错过第六

美国任然是超级计算机应用最广的国家,前十中有六个系统。值得注意的是,印度已经第二次进入了TOP500的前十名,应用的是惠普Cluster Platform 3000 BL460c系统,并且整合了自己的创新路由技术,使其性能达到132.8 Tflop/s而名列第八。

6月24日,曙光将正式发布峰值运算能力达每秒200万亿次的5000A超级计算机,该机将部署在上海超级计算机中心。可惜的是该机错过了TOP500.Org今年6月的榜单,否则可以位居第六。

不过曙光5000A在申报2008年11月的全球超级计算机500强排行时,还是很有机会进入前10的榜单。

在国上榜的15台(含台湾3台)系统中,格局仍然没有变化。在中国大陆上榜的12台计算机中,排名最靠前的是2007年部署在中国石化胜利油田的一台IBM计算机,峰值运算能力为每秒18.6万亿次,现排名111位。另外中国石油有4台同样型号的IBM计算机上榜,每台的峰值运算能力为每秒9.3万亿次。其它进入500强榜单的几台超级计算机则分布在电信、气象、地理和物流等行业用户。

TOP500前十名榜单: