2017年中国高性能计算机性能TOP100排行榜发布,这是第十六次榜单发布,这次榜单发布有多个突破,许多变化。
今年的榜单TOP10中,前四并没有什么变化,排名第一的仍旧是神威太湖之光,排名二到四的是来自国防科技大学的机器。
排名5到10的机器中有四套系统来自浪潮,有两套来自曙光,这其中曙光是HPC榜单中的常客,浪潮的四套系统着实吸引眼球,不过这四套系统均来自网络公司A。据笔者猜测,应该是阿里巴巴。
每年的榜单关注度都非常高,对服务商来说,夺得榜单第一意味着市场影响力,技术水平,服务能力的综合评估后的肯定,尽管榜单前四都没有什么变化,但是榜单本身的角逐非常激烈。据介绍,为了迎合新的发展趋势,TOP100榜单评审组也在不断变化评审标准,与时俱进。
今年的榜单相对于往年最大的变化是TOP100的含义,以往的TOP100是指性能排名在100以内的系统,今年则是性能座次表的前100,意思是说同一个服务商提供的同等计算能力的系统都只算一个座次,也就意味着一个座次可能有多个系统并列。
按照这样排,第100座次的曙光TC6000超级计算机其性能排名是124名。
超算的精神是更高更强,不断进步发展的超算才有看头。今年的第一百名性能比去年高出1.51倍,100台系统的平均性能比去年高出1.13倍,整体性能表现仍在不断精进。
从系统厂商的份额来看,TOP100中,浪潮以46套系统位列第一,这点出乎许多人意料之外,其实,在发布前的预测中,很多人都记得联想和曙光连续多年并列第一,不曾想被后来者浪潮在数量上有大的超越,联想和曙光分别有22套系统进入榜单。
另外,值得注意的是华为也以五套系统进入榜单,不得不说,华为的发展势头非常凶猛。另有国防科大的三套系统,这三套就是仅次于神威太湖之光的三套,另外一套是来自国家并行机工程中心,还有一套HP(其实现在应该叫HPE)的系统,这是仅有的一套外国服务商提供的系统。
有专家预测表示,根据现在了解到的许多在建和规划中的超算中心来看,明年的TOP100榜单将会是全国产服务商的天下,外国服务商从此在TOP100榜单上绝迹。
TOP100榜单的系统中,有近一半的系统是做大数据和机器学习的,另外有30套系统是做互联网和云计算业务的,近三年来,这一比重不断增大,互联网公司,云计算业务的兴起对超算业态带来很大的变化,也为超算找到了新的发展空间,应用场景和前进的动力。
不得不说,超算的应用领域,至少从TOP100榜单来看,已经走出了超算只属于科研工业领域的刻板印象,超算在安全,在科学计算等领域都有所应用,这点并没有大的变化。
从超算构成的硬件体系架构来看,近年来的趋势也非常明朗,其实主要就是CPU和GPU在超算领域的地位之争。从图中可以看到超算领域对GPU和CPU应用的倾向性。
2013年以前,GPU的体系架构占据主导地位,这是因为并行计算能力对超算很重要,是非常核心的能力。2013年,英特尔推出了Xeon Phi协处理架构,由于英特尔在市场的独特地位,明显对市场带来了变化,不过这一变化在2015年迎来大的逆转,此后,GPU的表现一路攀升,到今年,只有2套系统采用的是英特尔的Xeon Phi处理器,这两套系统就是天河二号。
抛开CPU和GPU在超算领域的应用特性之争,我们或许可以从禁运事件来理解这一变化,2015年2月,美国商务部将我国国家超级计算长沙中心、国家超级计算广州中心、国家超级计算天津中心和国防科技大学四家机构列入芯片限售之列,而这些机器使用的是英特尔微处理器芯片。当时,“天河二号”连续拿下了“四连冠”,许多人认为可能是感受到了来自中国的压力才做出如此决策的。这可能对英特尔的份额带来影响。
超算硬件体系架构的另外一个重头部分是互联系统,超算的互联系统主要就是千兆以太网,万兆以太网,IB和私有网络,千兆以太网实在已经非常落后了,仅仅三四年时间,超算TOP100就彻底完成了千兆到万兆的转变。另外,IB的份额近年来也在连年下降,另外,采用私有网络的网络架构表现非常稳定。
TOP100系统所有者都是谁呢?互联网企业占了多半的江山,其他企业紧随其后,HPC的用户了77%都是企业用户,政府部分,超算中心,科研院所都非常少了,今年,高校第一次完全退出了榜单。有专家表示,以后的高校就不要自己建超算了,干脆都用云服务算了,这也是一种声音,反映出一些新的变化。
总结超算发展的历史数据,榜单还对未来做出了预测。数据显示,平均性能受第一名的影响较大,最后一名,也就是TOP100榜单的门槛每年在一1.5-2倍的速度往上涨。预测显示,2018年入榜性能将会为1.2-1.2PFLOPS,2019年前后将会出现E级系统,这一预测其实并不难,或许,已经在建的超算中心就有这种实力。
看完今年的榜单信息,笔者感受最深的是互联网公司超算入榜这件事,而且规模之大,速度之快令人叹为观止。互联网公司的加入影响着超算的业态,有人担心互联网的超算系统对传统超算中心带来冲击,从技术能力,到服务能力方面带来挑战。另外,超算本身的变化最大的就是与AI的更深入的结合,AI的飞速发展将对继续超算带来深刻的变化。另外,技术应用上的创新和普及都将加速超算发展。