10月28日,在全国高性能计算学术年会(HPC China 2010)上,中国软件行业协会数学软件分会、国家863高性能计算机评测中心、中国计算机学会高性能计算专业委员会联合发布了《2010年中国高性能计算机性能TOP100排行榜》。
经过分析该榜单,IT168服务器频道认为至少有以下五个新的关注点:
一、天河一号TOP100再夺魁,有望冲击TOP500冠军
在2010年5月底的国际TOP500排行榜上,曙光星云(Nebulae)系统凭借1.271PFlop/s的Linpack性能获得了第二名的位置,这是中国超级计算机界在国际舞台上有史以来取得的最好成绩。时隔半年,本以为在今年的国内TOP100排行榜上,曙光星云会稳拿冠军,没想到半年杀出了个程咬金,由国防科大生产的天河一号继2009年之后再度夺魁。
在过去一年里,天河一号进行了大升级,目前的配置是14336颗英特尔六核至强X5670 2.93GHz CPU和7168颗Nvidia Tesla M2050 GPU和2048颗自主研发的八核飞腾FT-1000 CPU。处理内核数突破20万颗,是去年24576颗的8.25倍。其实,天河一号不仅仅是升级,而是几乎更新了整个结构,上一代采用的是英特尔四核CPU+ATI GPU,通过Infiniband互连,而新一代则是英特尔六核CPU+NVIDIA GPU+自主八核飞腾CPU,通过专有网络互连。
天河一号的峰值计算性能达到了4.7Pflops,即每秒4.7千万亿次,是上一代的3.9倍,Linpack值达到2.507Pflops,达到上一代的4.4倍。与排名第二的曙光“星云”相比,天河一号的峰值性能是其1.57倍,Linpack性能是1.97倍。另外,通过采用双精度性能更高的GPU后,天河一号的系统效率,即Linpack值与理论峰值的比率,也由原来的47%提高了现在的53.3%。
而且,值得一提的是,天河一号的Linpack性能比目前TOP500第一名的Cray机器还要高,是后者的1.425倍。因此,天河一号还非常有希望在11月中旬将要公布的新一期TOP500中取得冠军地位,结果如何,让我们拭目以待。
TOP10系统如下表所示:
二、10万核以上的超大规模计算系统出现,应用堪忧
在今年的TOP100排行榜上,出现了两台拥有10万个处理内核以上的超级计算机系统,这些内核包括普通的CPU核和GPU核。其中,天河一号的计算内核数更是超过了20万颗,达到202752颗。TOP10系统采用的处理器核数如下表所示:
这种超大系统的出现对技术和应用两方面都提出了很多挑战,包括计算效率、功耗、管理、I/O、占地面积、应用软件等等,尤其是应用软件可能会成为很大的瓶颈。据上海超算统计,2009年其使用16核以下的作业占到了60%,17-160核的作业占39%,160核以上仅仅占到1%。这也意味着很多大机器被各类超算中心买去之后,实际上都会拆分成若干块分给不同单位或部门去使用,因此并没在起到大机器应有的作用。
▲
要解决这个问题,一方面,我们需要开发出可以使用到千核以上的应用,以充分发挥大机器应有的作用;另一方面,其实也可以考虑将“HPC与云计算”更好结合,让高性能计算资源池化和自动化,让更多中小企业来使用。
三、GPU加速流行,其中5套进了TOP10
GPU加速已经成为做大系统的“绝招”。在最新的榜单上,采用CPU+GPU混合架构的高性能计算机就达到了7套之多(如下表所示),而且都是2010年新安装的,其中有6套是英特尔CPU与NVIDIA GPU的搭配,另一套是英特尔CPU与AIT GPU的搭配。而且值得关注的是,在TOP10中,就有5套采用了CPU+GPU的结构。
英特尔与NVIDIA这对老冤家明争暗斗,没想到在用户这里却成了好搭档。从大多数系统所使用的GPU来看,基于Fermi架构的NVidia Tesla C2050受到了一致的青睐。这也似乎意味着NIVIDA在经过几年艰辛推广之后,终于迎来了春天。
不过值得注意的是,GPU系统也并非完美无缺,除了软件编程和移植比较难之外,计算系统效率低也是此次TOP100反映的一个现实。这7套GPU系统的计算效率都比较低,最低的只有18.3%,最高的也不过54%,而一般CPU集群的效率最高可突破90%,比如排名第20位的安装在南京大学的IBM BladeCenter HS22刀片集群的效率就达到92%。
四、厂商集中化趋势非常明显,曙光和IBM占三分之二
从最新一期的TOP100来看,厂商的集中化趋势非常明显,表现在:一是有一些厂商退出了排行榜,比如SGI、银河风云、蚬壳星盈等;二是份额越来越多的掌握在少数两三家厂商手中,仅曙光和IBM两家的份额之和就超过了62%,几乎在重演2007年的市场格局。
▲
另外从发展趋势来看,笔者统计了2007年-2010年的数据,发现曙光和IBM都在不断扩大各自在HPC领域里的优势地位,尤其是IBM已经连续四年稳步增长,曙光今年的增长幅度也尤其高,相反,HP的份额却在不断减少,一增一减形成了非常鲜明的对比。
▲
显然,厂商的过度集中化,对于整个产业的健康发展并非好事,因为一方面市场需要竞争,从而可为用户提供更高性价比的产品和服务,另一方面,产业也需要创新,特别是在云计算、物联网的时代,需要有众多的、有不同专业优势的大小厂商一起参与创新。
五、高性能计算在物联网的应用值得关注
石油勘探、科学计算、互联网、工业、电信、教育仍然是我国高性能计算的主力军。不过,随着许多新兴行业的发展,也对大型超级计算机产生了新的需求,比如生物信息、视频计算、动漫渲染、电子商务等。
▲
今年尤其值得关注的是HPC在物联网领域里的应用——无锡物联网云计算中心的曙光5000排在第80位。物联网的发展会产生大量的数据需要计算处理,对超级计算机有着强烈的需求,虽然目前物理网还处于起步阶段,但相信随着物联网的发展,会有越来越多的HPC系统出现。