华中科技大学在至强融核上实现6万倍加速比

日前,在2013亚洲大学生超级计算机竞赛(ASC13)总决赛上,华中科技大学在基于英特尔集成众核(MIC)架构的英特尔至强融核协处理器上,成功对计算金融BSDE应用进行了优化,该应用优化后,与优化前的CPU串行程序状态相比,性能实现了6万倍的提升,震惊海内外超算界,当之无愧获得“MIC应用优化奖”。据悉,6万加速比的结果有300多倍来自并行化、向量化、访存等优化,200多倍来自算法的优化,充分展示了年轻大学生的创新能力和对应用的深度了解。

华中科技大学获ASC13大赛MIC应用优化奖

ASC全称Asia Student Supercomputer challenge,是与美国SC、德国ISC大学生超算大赛并驾齐驱的全球三大超算赛事之一,该赛事是亚洲第一个国际性超算赛事,由中国倡议成立,日本、俄罗斯、韩国、新加坡、沙特阿拉伯等国家及地区的专家和机构联合发起和组织,并由浪潮集团主办。大赛旨在推动亚洲国家及地区间超算青年人才交流和培养,提升超算应用水平和研发能力,发挥超算的科技驱动力,促进亚洲科技与产业创新。

据了解,华中科技大学是第一次参加同类国际比赛,与华中科技大学同场竞技的高校参赛队都堪称翘楚,他们从43所亚洲各地区高校中被选拔出来,包括:台湾清华大学、上海交通大学、国防科学技术大学、中山大学、华中科技大学、韩国蔚山科学技术大学、香港中文大学、圣彼得堡大学、沙特阿卜杜勒阿齐兹国王大学。其中,曾摘得德国ISC12桂冠的清华大学、连续两届荣获美国SC大赛冠军的台湾清华大学、一度蝉联ISC12、SC12最高计算性能奖的国防科学技术大学、还有主场作战的上海交通大学等是赛前讨论的热门话题。

根据大赛组委会公布的规则来看,参赛队需要在3000瓦功耗限制下自行设计搭建超级计算机系统,并进行HPL、GROMACS、OPENCFD、WRF、BSDE等5项优化测试,大赛对各参赛队的超算理论基础和实践操作技能提出非常高的要求,尤其是BSDE应用,其要求为基于单至强融核协处理器超算平台的应用并行化设计实现及性能优化。

华中科技大学最终实现的至强融核协处理器应用加速体现了他们对于众核并行的深度理解:在小规模算例上,华中科技大学采用在CPU上启动任务,将全部计算过程以offload模式交由英特尔至强融核协处理器完成的方案,对于大的算例则采用CPU与至强融核协处理器协同计算,通过offload signal/wait方式将一部分计算任务交由至强融核协处理器异步完成。对于不同方案之间的临界点,则根据现场实测结果用MATLAB进行曲线拟合分析得到。在以上方案的基础上,华中科技大学还采用优化数据访问方式、算法模型优化等方法加快应用运行。此外,他们还将应用热点中的多次计算任务合并成一次计算任务,并提到循环外,避免重复计算,使用访存的时间代替计算任务执行的时间,大大提高了并行应用性能。

谈到准备工作,华中科技大学的参赛队员说:“赛前深入研读了浪潮-英特尔中国并行计算联合实验室的《MIC高性能计算编程指南》,我们对英特尔集成众核(MIC)架构的特点和应用优化方法有了比较全面的认识,这对我们取胜帮助很大。”

ASC13大赛评审委员会专家对此点评道:“华中科大取得的成绩表明他们对英特尔集成众核(MIC)技术理解很透彻,充分掌握了相关并行编程模式和算法优化技巧。基于英特尔集成众核(MIC)架构的加速技术具备高并行化和易上手的特点,已成为当今领先的潮流技术。我们希望通过比赛实际动手让青年大学生了解掌握最新的超算技术,激发他们的创新能力。”据悉,除华中科技大学外,清华大学、中山大学也通过充分利用英特尔集成众核(MIC)架构的高并发和优化数据访问、算法模型等方法获得了上万倍的性能提升,而其他参赛队也获得了上百倍的性能提升。