先进计算时代来临,曙光下一步的发展关键是什么?

先进计算是什么?

说起计算,你能先想到什么?高性能计算、云计算、智能计算、量子计算、类脑计算、边缘计算?中科院先进计算技术创新与产业化联盟秘书长任京暘认为,计算形式如此之多,与需求密切相关,今天我们已经进入到了计算多元化的时代。

这种变化并不是突然就出现的,早在国家十三五规划中就出现了对先进计算的描述,所谓先进计算是指:要重点发展比如E级计算、云计算、量子计算、人本计算、异构计算、智能计算、机器学习等技术的研发及应用。看到这里,我们发现可以先进计算其视为对如今多元化时代计算发展特征的一种概括。

作为中科院先进计算技术创新与产业化联盟秘书长的任京暘介绍了先进计算联盟所做的工作,2014年,中科院先进计算技术创新与产业化联盟成立,三年来,联盟成员联合对通用技术展开过攻关,取得了许多成绩。

例如,联盟成员联合申请成功了一个大科学工程,叫做地球数值模拟装置,目前已经经过了发改委的立项,在北京怀柔大科学中心里面将会正式落成。在推动先进计算的产业化方面,联盟成立以来已经新成立了两家公司,一家是中科三清环保科技(北京)有限公司做大气雾霾治理,另外一家中科星图是做卫星数据的再开发再利用,两家成立不久的新公司已经有了过亿的营收了。

下一步,联盟的工作将围绕三个方面展开,一个方面对原有计算的优化升级,优化原有的主流的计算方式,比如说高性能计算、云计算、大数据计算等。第二个,在未来发展中更注重与应用的融合。第三个方面,颠覆创新,关注可能出现颠覆性的突破性的技术,比如在在类脑计算领域,在量子计算领域等。

曙光能为先进计算做什么?

任京暘除了是中科院先进计算技术创新与产业化联盟秘书长以外,还是曙光公司副总裁。印象中的曙光是做超算基础设施的,有超算服务器,存储基础设施,在计算领域有着长期且深厚的积累,任京暘大谈先进计算,那么曙光能为先进计算做点什么呢?

曙光是计算领域的老司机,在超算领域的积累非常深,从曙光1号到曙光600,曙光的创新技术不断涌现,在现场任京暘介绍了许多先进计算时代的创新计算技术和成果。

比如有绿色计算,这是一项解决能耗相关问题的技术,大数据领域,曙光有一系列的大数据引擎,并且有许多硬件来支持不同的大数据引擎。

在人工智能领域,曙光推出了许多基于CPU、GPU融合的产品,这一市场需求非常火热。

在量子领域,曙光积极参与了量子通信方面,不久前曙光联合友商还发布了一款量子通讯的云安全一体机,已经到了商用阶段,不过,仍需要持续优化。

在量子计算领域,曙光与国内一些优秀的团队、科研院所做紧密的合作,建立联合实验室来推动量子计算发展,为的是让量子领域快速地走近实用阶段。

云计算领域,曙光有城市云规划,曙光在国内40多个城市、地区建立了城市云计算中心,提供云计算整体的服务,众多云联成“城联网”,在城联网的基础上随着数据量的进一步丰富产生一些新的应用。

笔者认为,EasyOP是一个服务型的软件解决方案,可以提升超算用户的使用体验。曙光的立身之本就是做高性能计算的,为了让高性能计算更好的服务用户,让用户用的更顺手、更方便,曙光推出了EasyOP解决方案,帮助用户把计算服务用得更好。

在本次高性能计算学术大会上,能明显感受到笼罩在许多传统超算中心从业人员心头上的疑虑:互联网公司来了,我们该怎么办呢?

其实,互联网公司最强的是服务能力,是优化用户体验方面的能力,可以从提升自身的服务水平方面入手。而超算是一个非常精专的领域,有很强的行业属性,对超算应用的理解需要长期积累,这是原来的行业人员所具有的优势,这正是曙光这样的超算专家的优势所在。

先进计算时代,发展的关键是超算运维服务

任京暘认为,先进计算时代的计算多元化发展,使得服务能力变得尤为关键,原来的系统用户就能用起来,而现在的计算模式越来越复杂了,融合是关键的一步,融合后的服务更关键。

为此,曙光与中科大等单位一起共同探索做多元计算时代计算服务问题,双方合作建成了一个在线运维中心,服务于中科大的多个部门,未来还将面向广阔的市场,向外界提供服务。

曙光与中科大的合作始于去年,最开始是跟中科大的网络中心联合做运维服务,主要解决用户日常管理问题,使用运维服务手段解决日常使用的问题,然后把一些闲置的资源利用起来。

与此同时,还会做一些深层次的优化服务,面向不同的应用特征做优化。而且,还面向专业用户提供生产数据的服务,循环利用一些复杂的测试数据,提供通用的共享服务。另外还可提供针对业务的集群维护服务,从针对硬件角度、架构角度出发,未来还要针对业务做维护。

这些是互联网的数据中心所不具备的能力,行业能力。

曙光通过EasyOP与中科大的网络中心成立了运维中心,为用户提供硬件系统的运维、超算系统的巡检、应用软件调优和作业报表分析这四项功能。

EasyOP从2015年11月开始到现在已经上线了22个月,已经为80多个用户提供了运维方案。目前EasyOP监管的节点已经超过了一万个以上,并且对所有的接入集群的各个节点已经覆盖了超过180项的监控指标,大约为750万个大小作业提供了各类支持服务,其中40%以上提供了针对应用特征的优化,为CAD、气象、海洋、物理、生物、高分子还有深度学习等7个领域做深度优化。

在2017高性能计算学术大会期间,曙光与中国科技大学联合成立了一个服务于华中地区的“EasyOP高性能计算在线服务平台(安徽分中心)”,曙光表示未来还将陆续在全国区域内建立分中心,分中心之间相互合作,借鉴经验,共同繁荣发展。

我们看到,曙光的有专业的运维平台,定制的托管服务,还有专家深度支持,还能为用户提供HPC应用服务市场,最终形成以EasyOP为依托平台的交易生态平台。

在这一平台上,用户可以方便地采购或者出售闲置的资源,可以分享科技成果或者计算模型。希望以这样的平台加速计算服务时代的到来。