斩获HPC TOP 100 第三,北京超级云计算中心加速超算应用成果落地

最近中国人再次获得戈登贝尔奖的新闻刷了屏。

文本描述已自动生成

这可以说是今年SC20大会上对于中国来说最大的利好消息。许多局外人可能是第一次听到这个奖项,但是对于超算行业来说,戈登贝尔奖(Gordon Bell Prize)就相当于“诺贝尔”或者“奥斯卡”,是行业顶尖水平的证明。今年的大奖被颁发给了深度势能(DP)团队,以奖励他们在分子与材料模拟领域做出的贡献。

所谓“工欲善其事必先利其器”,很显然,要想获得出色的应用测试成绩,必须先有领先的计算平台,而伴随着神威·太湖之光的出现,中国人已经连续获得了2016和2017两届戈登贝尔奖,也证明了想要获得顶尖大奖必须要有顶尖的计算机做支持。而除了神威·太湖之光和天河二号A之外,中国排名第三的超算平台则是北京超级云计算中心A分区,恰好它在赛前也被用来进行相关的计算任务。

据悉,深度势能(DP)团队计划将核心软件DeePMD-kit和DP-GEN部署在这套系统中,并通过同样部署在平台上的软件系统实现对于CPU/GPU资源的调取,加速计算提升效率。与此同时,这种“云化”的方式可以帮助项目团队大大节省系统采购、搭建和运维的成本,实现了按需支付、按量付费,让队员将更多时间和精力投入于科研本身。

如图片无法显示,请刷新页面

那么,这个用于提供“算力池”的平台有多强的计算力呢?据最新公布的中国高性能计算机TOP100榜单介绍,北京超级云计算中心A分区的Linpack测试性能达到了3.74PFlops,成为HPC TOP100榜单第三名。相比前两家国字头的超算中心,成立于2011年的北京超级云计算中心一直走的都是市场化的路线,通过“云化”的超级云计算服务模式布局通用超算市场,着力服务于对算力不同需求的科研用户。

其实,“云化”的超级云计算服务模式并不是一个新概念,早在公有云开始普及的时代,就有先行者进行超算“云化”的研究。在许多人印象中,“云”为计算带来的更多是便捷性而不是性能优势,或者说弹性可扩展才是“云”的核心,而对于性能和稳定性要求极高的超算似乎并不适合“云化”。

但现实却给持有这些观点的人“上了一课”,这次戈登贝尔奖就是最好的证明。可能有些人会说,那么多大型的超算中心,难道还不能保障算力吗?事实上,虽然国内有多家超算中心可供选择,但许多时候这些超算中心承载的都是国家级关键科研项目,正因为“尖端”的定位,使得这些超算中心自然优先为这些项目提供充足的算力保障,而对于中小超算用户来说,一旦遇到这样的情况就好比“交通管制”一样,对于正在进行的业务也会造成无可估量的影响。

那么许多提供超算的公有云平台会是好的选择吗?这个问题很难用“好”或者“不好”来评价,因为如今许多公有云都支持超算项目,甚至还提供了高端的GPU进行支持;但与之相对应,这些公有云平台的价格也非常“感人”,相对于超算中心动辄几倍的价格让人“肉疼”,尤其是对于本身科研经费就紧张的机构或者高校来说更是望而却步,同时在服务的专业性上也需要提升。

如图片无法显示,请刷新页面

那么是否有既能提供高效、稳定、安全的计算服务,又能具备超高性价比的平台呢?许多用户都将目光聚焦到北京超级云计算中心的身上。作为专业的超算云化服务平台,北京超级云计算中心可以提供相对充足的算力给客户,满足广大中小微企业的需求,并且在服务上有专业人员进行系统维护与程序调优,保障每一项作业都运行在优化状态;而在价格上,北京超级云计算中心也重点突出性价比优势,用户通过租赁来完成业务部署,可以从复杂的自建与运维中解脱出来,更专注于科研本身。

凭借着“超级云计算”的特性,北京超级云计算中心将原有的计算、存储、网络设备实现了硬件解耦,构成了一个个资源池。用户在租赁资源的时候丝毫不需要考虑选择怎样的设备或者怎样的平台,只要确定自己所需的资源数量,平台就会从资源池中划分对应的份额,如此也改变了以往超算中心资源排队的情况,满足了用户“更多计算资源、更快计算速度、更好用户服务体验的需求”。

正是在这样的运营和管理下,北京超级云计算中心为用户构建了一个集硬件资源、计算环境、平台服务、智能调度为一体的“一站式”服务创新平台,通过“超级云计算”的方式改变了传统超算的运营模式,实现了自身算力的突破和商业创新,也让用户有了更为广阔的发展空间。

图表, 气泡图描述已自动生成

除了计算层面的硬件优势之外,丰富的解决方案也同样让北京超级云计算中心得到业界公司的关注。金风科技是能源行业的领跑者,它的到来则是因为看重了北京超级云计算中心能够提供行业化的专属资源支持方案。针对能源行业的算力需求特性,北京超级云计算中心提供了独占、包核时等多种使用方式,同时在高峰期还提供了弹性扩展能力,大大提升了作业效率,助力了业务发展。

如今,北京超级云计算中心按“随需供应、动态扩容”划分为多个分区,其中包括了A分区、T分区、M分区、IO分区以及科技云9分区、12分区、15分区、17分区、19分区等等不同的分区,满足各种层级客户的需求。

一直以来,中国超算都是“重硬轻软”,在基础设施上我们是超算大国,但是在应用上并不是超算强国。伴随着多次获得戈登贝尔奖之后,我们发现中国的软件应用能力正在逐步提升,而这种提升正是得益于算力的不断升级。这其中,既需要以国家级超算中心为代表的“尖端超算”领衔,更需要类似于北京超级云计算中心这样性能出众、服务优异的商用超算平台的支持。

超算是一个完整的生态,从超算中心到上层应用,从计算、存储、网络到服务、运维、管理,这背后的每个环节都需要大量的投入,包括超算人才的培养也不是一朝一夕能实现的。从这个角度来说,北京超级云计算中心所代表的仅仅是如何“用好”超算的环节之一,我们也需要更多类似北京超级云计算中心的企业共同努力,推动中国从超算大国到超算强国的转型,向着百亿亿次的目标坚定迈进。

中国前三、戈登贝尔都只是里程碑,未来的超算之路还有更远。