超级计算机更需要“软”实力

全球超级计算机Top 500排行榜发布,很多时候演变为一场数字游戏,计算能力提升了多少,门槛提高了多少,各家厂商占比,不同技术的占比等等,常常被津津乐道。
 
一组数字
新上榜的系统中,Intel架构系统占95%,也就是说,新上榜的87套HPC系统中,Intel架构占了83套。全部TOP500中,77套采用了E5 v3至强处理器,139套采用了E5 v2,合计216套。协处理器方面,33套HPC系统的Intel Xeon Phi协处理器的系统浮点计算能力大于其他55套其他协处理器的总和。
 
面对这样的一个成绩单,英特尔有理由骄傲和自豪。
 
跳出画面看画
如果不被单纯的数据所迷惑,很快就会意识到应用的问题,因为只有提高应用的水平,斥巨资投建的Top500系统才能够最大程度发挥作用。
 
如今,软件仍然是高性能计算机应用的短板,很多软件还是串行应用,GPU也需要软件编程的支持。克服这些障碍,系统应用水平就可以更进一步,从而充分发挥高性能计算机的威力。
 
“懂计算机的,不懂应用;懂应用的,不懂计算机。”这就是目前软件并行化的难题。相对来说,要计算机懂应用就更为艰难。大多数情况下,专业人员需要自己开发软件或者算法,这些软件或者算法具有很强的指向性,通用性不强。
 
为推动软件,特别是软件并行化的进程,英特尔从2013年开始在全球启动并行计算中心,如今已经在全球15个国家建立,今年4月与中科院合作,在中国建立了首家英特尔并行计算中心(IPCC),围绕LAMMPS分子动力学模型并行优化、相场动力学模拟软件开发与中科院的专家进行合作。
 
并行计算中心的成果对于材料科学、生命科学、计算化学、计算物理等领域的应用研究将产生重大影响。通过跨领域的开发者、科学家、技术专家的培训分享、技术交流等活动,该中心对16个领域,超过80种应用软件针对至强融核(Xeon Phi)进行开发和优化了,著名科学家斯蒂芬霍金教授所创建的的剑桥大学理论宇宙学研究中心(COSMOS)也得益于英特尔架构计算平台的优化。
 
开花结果
 
尽管时间不长,但英特尔中国并行计算中心已经取得很多成果。
 
据中国科学院超级计算中心主任助理王彦棡介绍,IPCC的工作分成两部分:一是专门做求解偏微分方程的求解,针对于刚性偏微分方程的需求,可以在大时间尺度下做相场计算,同时计算结果保持一致。以模拟1024 三次方解方程为例,在一个2个CPU和2个MIC单节点上,性能可以做到1300G浮点运算能力,接近理论值性能的52%,其中负载均衡、通讯兼容叠加等技术发挥了非常重要的作用。而在此之前,一个节点的性能发挥仅为6%~7%,这也就意味着,通过优化,如今的一个节点相当于以往几十个节点的计算能力。IPCC另外一个重点是针对开源软件提供支持,自己做算法开发,提供DPD算法并注入到LAMMPS,将最终的代码会以API的形式放到LAMMPS当中,以开源方式对外发布。
 

 
围绕着Top 500,头顶着“国家科技实力象征”的光环,高性能计算始终被舆论关注。天河二号,连续5届排名榜首也确实为我国争取了不少荣誉。但越是这个时候,专业人员越要保持清醒的头脑。
硬实力固然重要,但“软”实力同样不可或缺,甚至更加重要。