在刚刚结束的2011全国高性能计算学术年会(HPC China 2011)上,中国软件行业协会数学软件分会、国家863高性能计算机评测中心和中国计算机学会高性能计算专业委员会公布了最新一期“2011中国高性能计算机性能Top100排行榜”。我们首先来看一下排行榜今年的主要变化。
与去年相比,前十名中由国防科大研制、落户在国家超级计算天津中心的天河一号A继续保持第一的位置;由国家并行计算机工程技术研究中心研制,落户在国家超级计算济南中心的“神威蓝光”超算系统取代了去年曙光星云的位置排名第二。第三位也是国防科大研制,安装在国家超级计算长沙中心的天河一号A-HN。去年由曙光公司研制,落户国家超级计算深圳中心的曙光星云系统排名第四。第五名之后的情形与去年相仿,变化不大。以下是Top10的排名:
虽然本次“神威蓝光”没有取得排名第一的成绩,但对于国内高性能计算领域来说具有非比寻常的意义:这是首台全部采用国产CPU构建的千万亿次超级计算系统。
中国计划在天津、深圳、济南建设3个国内领先的超级计算系统研发、应用中心。其中天津超算中心已经装备了排名第一的天河一号,而深圳超算中心也在去年装备了曙光研制的星云超算系统。如今,济南超算中心正式挂牌,而这套由浪潮帮助山东信息通信技术研究院打造的“神威蓝光”系统采用了MPP万万亿次体系架构,全水冷散热方式,并且处理器全部采用了江南计算所研发的“神威1600A”多核处理器。
中科院软件所张云泉教授对记者表示,中国超级计算机全自主研发具有重大意义,不论从高速网络还是从国产化处理器在安全性和通用计算性方面已经达到世界先进水平。另一方面,全国产化的独立自主也标志着我国高性能计算系统已经可以走出国门,向其他国家出口。
全国产处理器显“神威”
“神威蓝光”超算系统是由国家并行计算机工程技术研究中心研制,获得科技部863计划支持,于2010年9月开始由浪潮集团承接该项目一同设计和建造而成的。该计算系统共计投资约6个亿,建设周期2年,本次揭牌进入Top100榜单的属于该系统的第一期工程。
从公布的数据上来看,“神威蓝光”超算系统全部采用自主设计生产的处理器(ShenWei processor SW1600),系统共8704个CPU,峰值计算性能1.07016PFlops,持续性能795.9TFlops,Linpack效率74.37%,总功耗1074KW。
该系统采用了8700个神威SW1600微处理器,该处理器拥有16个计算核心,主频在975~1100MHz之间——也得益于其流水线的减少,每个处理器的计算性能可以达到124.8~140.8Gflops。据介绍,该处理器的稳定性远胜于一般的x86集群,在Linpack测试中稳定的跑了近9个小时,一次错误也没有发生。
网络方面,“神威蓝光”采用了胖树结构,节点间采用了来自Mellanox的QDR Infiniband网络,其传输速度高达40Gbps,MPI消息延迟则小于2us。其存储系统的设计容量则达到了2PB,I/O理论带宽是200GB/s,适用于可续计算、MPICC、UPC、Fortran、C++和SWCC等常规科研环境和通用编程语言的程序。
此外,由于神威SW1600处理器的低功耗,该系统每个机柜拥有1024颗CPU,结合多种节能技术和水冷技术其能效比达到了741.06MFlops/W。据了解,“神威蓝光”的冷却用水是内部封闭循环,并且是来自矿泉水厂处理过的纯水。该技术与以往的水冷技术相比,由于是内部循环,因此节约了大量的水消耗和风冷消耗。
另一个亮点在于“神威蓝光”基于预警和数据挖掘的前瞻式主动容错技术,该技术大大提升了该系统的稳定性和可靠性。而基于虚拟化的资源池结构支持在线迁移功能,也大大方便了作业任务调度。
以下是“神威蓝光”和“天河一号”以及“星云”系统的比较。