ASC13决赛探秘 清华大学如何夺得HPL冠军

4月15日-19日,2013亚洲大学生超级计算机竞赛(ASC13)在上海交通大学举行,来自中国大陆、香港、台湾、韩国、沙特阿拉伯等6个国家和地区的10支队伍进行了5天的激烈角逐,在开局第一场HPL比赛中,清华大学以7579Gflops的成绩拔得头筹,该成绩刷新了同类赛事中HPL测试的全球最高纪录。

HPL即High Performance Linpack,也叫高度并行计算基准测试,是目前国际上最流行的用于测试高性能计算机系统浮点性能的基准测试,也是各类超算竞赛的保留算例。该软件的原理是用高斯消元法求解一元N次稠密线性代数方程组来测试高性能计算机的浮点性能。

ASC13大赛中,参赛队伍需要采用给定种类的设备搭建各自的超级计算机系统,在总功耗3000瓦的电力约束下,得到最高计算能力,就像“超级计算机的F1方程式赛车”,首先得造出出色的‘跑车’,然后在统一规则下跑出最快的性能。

从历届国际的ISC、SC赛事来看,HPL最高成绩均未突破4000Gflops,此次清华大学的成绩相比实现了近乎翻番的增长,因为IT技术的快速更新提供了性能功耗比远大于上一代平台的设备,这成为各参赛队成绩提高的重要技术基础。大赛主办方浪潮集团为大赛提供的都是最新技术产品,包括浪潮主力服务器NF5280M3,采用最新的Intel至强E5-2600平台,通过转接卡的方式可以支持2块GPU加速器,以及NVIDIA最新的GPU Tesla K20和Intel刚发布的MIC众核加速卡, Tesla K20在功耗不变的情况下,性能可提升3倍有余。

清华大学能够力压群雄夺得冠军,不仅因为其长期参加各类超算赛事,积累了丰富的参赛经验,也源于其对最新计算技术的深刻理解和娴熟操作。选择单纯的CPU集群,还是CPU+GPU的混合集群,还是选用CPU+MIC集群,平台策略选择这只能由各个参赛队根据以往的经验来作出,最终,清华大学选择了CPU+GPU混合集群,而且采用了每台服务器搭配两块GPU加速卡的激进做法。据了解,此前其他参赛队伍提前将该方案进行了测试,不仅加速比情况不理想、设备过热,而且很容易超出3000瓦的功率约束。显然,在参赛前,清华大学已经很好地解决了上述问题。

HPL算例是对参赛队伍软硬件知识技能的全方位考量,充分体现了大赛的终极目的——加快超算人才培养。参赛队伍要取得更好的测试成绩,需要完成对超算系统体系结构、多级存储一致性、高速网络、算法优化等方面全方位的综合研究,在不仅要在混合架构、单一架构等方案之间比较选择,还要结合性能功耗比加以反复优化和测试。

据了解,ASC是与美国SC、德国ISC大学生超算大赛并驾齐驱的全球三大超算赛事之一,该赛事由中国倡议成立,日本、俄罗斯、韩国、新加坡、泰国、中国台湾、中国香港等国家及地区的专家和机构联合发起和组织,由浪潮集团主办。推动亚洲国家及地区间超算青年人才交流和培养,提升超算应用水平和研发能力。