浪潮 发表于:14年08月12日 10:34 [来稿] DOIT.com.cn
近来,超算竞赛在推进应用和培养人才方面的独特价值和巨大作用已经得到超算专家、用户和教育界人士的高度认可。为提高竞赛的精彩程度并考察参赛学生的综合能力,ASC、ISC和SC三大超算竞赛主办方在各自的赛题设计方面都进行了精心设计。如ASC14设计了参赛队在全球最快超级计算机天河2号实战演练并行优化行业应用的赛题并设置了e Prize奖,而在刚刚在德国举行的ISC14超算竞赛也设计了一道颇具特色的神秘应用赛题。
今年6月在德国莱比锡举行的ISC14超算竞赛上,竞赛组委会现场公布了本次竞赛的神秘应用赛题规则,即要求参赛队现场重新构建各自的超算系统,要求在20分钟之内运行出给定的Quantum Espresso算例的正确结果,成功完成任务且运行过程中功耗值最小的队伍获满分,其余成功运行出结果的队伍按和第一名功耗比例给分,没有完成任务的队伍零分。这道神秘应用赛题规则强调超算系统在运算作业和时间限定情况下要求尽可能优化运行功耗,充分体现了对超算实际应用性能功耗比的重视。这种神秘应用的竞赛规则是首次在国际性超算竞赛采用,极大的考验了各参赛队伍对超算系统构建的掌控能力、应用性能与功耗优化的平衡设计,以及团队协作和临场应变能力,成为本次ISC14超算竞赛的最受关注赛题。
开源量子分子动力学计算软件Quantum Espresso是扩展性较好的计算密集型应用,随着硬件资源的增加会加快计算,但同时也会使得功耗增加。该项赛题的难点在于,优化QE算例计算速度并非越快越好,而是要尽可能的平衡计算资源及应用运行参数,做到既能在规定时间内完成运算,也能在运行过程中的功耗值稳定并尽可能小。因此,为了降低功耗,除了减少使用的计算资源(减少CPU核数甚至节点数),也需要对计算平台进行“瘦身”,减掉平台中不必要的功耗消耗,如拆除平台上的GPU加速卡,拆除多余的内存条,甚至在散热条件允许的情况下拆除平台上的风扇等。同时,评分依据的是整个运行过程的峰值功耗,因此计算过程中功耗稳定没有起伏也是很重要的,这点可以通过应用的计算分配,控制负载平衡,以降低功耗峰值。
经过紧张的准备和角逐,南非高性能计算中心参赛队以最低1700W的峰值功耗成功运行作业获得了本题的满分16分,来自中国的清华大学参赛队和上海交通大学参赛队分别以以峰值功耗2400W和2700W成功运行作业分别获得11.33分和10.07分,他们成为本次11支参赛队中唯一成功完成本赛题的3支队伍,出乎意料的是其他8只参赛队因为各种原因出错最终都抱憾未能完成这道神秘赛题。
南非高性能计算中心参赛队
清华大学参赛队
上海交通大学参赛队
清华大学队长李恺威在谈及这段参赛经历时表示,这道神秘应用赛题非常有意思也极具挑战性,这道题检验了整个团队的综合能力水平,不仅包括系统的设计优化和硬件的稳定性,还有对应用的理解力以及灵活应变的临场发挥能力,才有可能在充满不确定性的神秘应用中挑战成功。他表示,ISC和ASC超算大赛从目标上都很明确,不仅考察参赛队伍超算知识的全面性、理解力和创造性,有着共同的应用优化诉求,而且强调实际动手能力来检验对超算知识的灵活掌握。
据了解,上海交通大学和清华大学的参赛队伍此前在ASC14超算竞赛中分别获得总冠军和应用创新奖,在ASC竞赛期间需要独立完成整套超算系统的动手搭建和调优排错;南非参赛队也是从参与了南非国家超算竞赛的队员选拔而成,由此可以明显看出,这些队员此前经历过的实际参赛动手经验为此次ISC14竞赛中取得好成绩打下了良好基础。
新规则的ISC14神秘应用颇有些“七步成诗”的味道,这种检验“即兴发挥”能力的比赛形式,也使超算大赛成为超算人才培养的“实战课堂”,这种创新赛题体现出超算竞赛对人才知识掌握的实际动手灵活应用能力的重视,值得在超算竞赛中进一步推广。