漆锋滨:神威太湖之光超级计算机的体系结构与应用性分析

10月27号,以“根植中国芯,超算中国梦”为主题的2016年全国高性能计算学术大会(HPC China 2016)正式在陕西西安的西安宾馆召开,大会由中国计算机学会主办,中国计算机学会高性能计算专业委员会、西安电子科技大学共同承办,北京并行科技股份有限公司协办。

100

这是一场工业界与学术界的交流大会,尤其在今年,全国产化的神威太湖之光冲破国外壁垒,令国人为之振奋。而今天上午主论坛,首场便是由国家并行计算机工程技术研究中心研究员、神威系列超级计算机系统常务副总设计师漆锋滨先生介绍神威太湖之光超级计算机的体系结构与应用性分析。

实际上,中国超级计算机的历史开端源于1957年,当时有二十位前辈奔赴前苏联学习高性能计算技术。也是从那时开始,中国人都在盼望能自己研发计算机。2016年,神威太湖之光终于现世,夙愿终成。

神威太湖之光体系结构

101

神威太湖之光的各项参数极佳,同等性能下,比美国的泰坦更加绿色节能,性能也更高。它的系统有40个运算机仓,每个机仓包含1024颗处理器,全机工40960颗国产申威26010众核处理器。

102103

如图为申威26010众核处理器的体系结构,该结构还提出了一种称为SBMD(单指令快多数据流)的执行模型,相比SIMD(单指令流多数据流)更具可用性,比MIMD(多指令流多数据流)减少了访问内存,提升了效率。

此外,该系统建立了主动容错和多策略被动容错相结合的软硬件系统容错体系,其稳定性之高,一晚上可以跑三次linpack测试,要知道该测试是不允许出错的,错了还要重跑一遍。

神威太湖之光的应用

104

全球Graph500——利用图论分析超级计算机在模拟生物、安全、社会以及类似复杂问题时的吞吐量并进行排名,而非仅针对比较传统的数值运算能力——排名中,太湖之光虽然位居第二,但确实前五位中唯一采用众核处理器的,申威26010单处理器运算速度就是Intel E5-2650V2的12.12倍。

105

神威太湖之光半年以来的应用案例

img_20161027_091019

在这里还要特别说明一下Gordon Bell奖,它设立于1987年,旨在表彰高性能应用领域内的杰出成就,号称超算应用领域的诺贝尔奖,30年来我国都未入围该奖项,而今年基于太湖之光的有3项应用(大气/海洋/材料领域)入围,占据了该奖项入围名单的半壁江山。

106

在漆锋滨先生演讲结束后,有人问及下一代E级原型机以及高性能计算的普及问题。他表示,E级原型机需要解决功耗方面的问题,其次是性能,第三是应用,但可以肯定的是使用众核架构来做。而对于高性能计算的普及要从学生做起,神威太湖之光对高校有优惠待遇,而前提是研究项目要有意义。

神威太湖之光是国人的骄傲这是毋庸置疑的,虽然我们距离超算强国仍有一定距离,但从今年HPC China 2016的火热召开,我们完全可以感受到由神威太湖之光乃至中国超算界的带动之下,一场已然兴起的超算热潮,愿其热度永不退却!