2022 OCP China Day召开:浪潮信息长袖善舞开放计算

数据中心建设有自己独特的情形。

如,在中国,地域差异巨大,北部、西北年平均气温在20摄氏度左右,最高气温不超过27度,这种情况下以最经济(如自然风冷)的方式散热就可满足国家双碳目标的战略要求。

若是在北京、上海、深圳、三亚等地建设数据中心,传统散热模式将产生难以想象的能耗。因此,液冷等在降低数据中心电力消耗方面成效显著的先进技术很有潜力。然而,尽管厂商技术开发实力强大、经验累积丰富,且有实力提供定制化设计,由于行业差异化巨大,单一企业采购规模又不足,这些技术在互联网行业得到广泛应用,但在金融、通信、能源、交通政府等传统行业很难普及,推广进展缓慢。

2022 OCP China Day 会场

“开放计算是一个非常好的平台协作模式。” 8月10日,在北京召开的OCP China Day2022上,浪潮信息服务器产品规划总监陈彦灵指出,借助这个平台,可以汇集领先的技术形成产业创新、产业生态,行业用户就可以非常方便地获取这些技术带来的改变,从而实现节能降耗、绿色低碳。在这个层面上,开放计算平台还将有助于东数西算战略的实现以及国家双碳目标的达成。

陈彦灵认为,东数西算将现有数据中心的布局变得更加合理。

东数西算是将东部发达地区大量的应用转移至西部运营成本较低的数据中心,并带动西部经济发展。但此举面临一个新的问题,即,设在西部的数据中心,在解决东部地区的应用延时会更长,因此其不适合常规的关键业务。为了满足其在备份、容灾以及未来元宇宙方式下成千上万的并发应用及分层等方面的适用性,大量相关的技术创新及成果也在不断更新和陆续推出中。

浪潮信息服务器产品规划总监陈彦灵

开放计算概念源于2011年成立的开放计算项目(Open Compute Project,OCP)基金组织,旨在成立一个能够像软件开放社区那样带来创新理念与创新设计的硬件开放社区,共同推动产业的发展。

10余年的时间,开放计算得到了快速发展,业界几乎所有的重量级企业参与其中。最新数据显示,全球OCP社区参与者已达1.6万人、社区成员240家,工程师超过5000人,项目数超过100个,开放计算标准服务器年销售规模达到470万台,提供算力占比全球34.8%;预计到2025年,全球将有40%的服务器基于开放标准

由于开放计算、OCP逐渐从互联网公司渗透拓展应用到传统行业,行业用户在开放计算的市场占比将上升至21.9%。

目前在中国的OCP成员数量已经发展到数十家、社区参与者超千人、落地产品规模高达上百亿,在开放计算数据中心硬件技术规范、接口协议、架构设计等多个创新方向做出重要贡献,同时也推动了OCP相关技术在中国的落地。

谁来决定开放计算的方向?陈彦灵认为,答案就是用户。超大规模数据中心客户正在牵引着ODCC、OCP;需求决定价值,贴近行业特别是传统行业,才是开放计算的生命力。这也逼迫开放组织不断自我改变。

开放的价值不止如此

开放计算主要围绕硬件以及硬件加底层管理软件展开,未来有可能衍生到发展侧。互联网行业已经尝到了开放计算带来的好处,数据中心的PUE达到1.3甚至接接近1.1,而近年来,金融、电信的采购规模也开始了跃升,但这些行业不少数据中心的PUE还在2.0左右,意味着30%的电力浪费。把领先的技术、领先的产品推广应用到传统行业任务很迫切。开放计算将帮助这些传统行业降本增效,让他们的业务运行更快更稳、能耗和故障率变得更低,最终获益的是广大用户。

后摩尔时代,以前单个CPU就能满足各种应用的现象已经难以为继,AI计算、存算一体化成为热潮,在音视频处理等方面,传统数据中心以CPU为核心的计算能力瓶颈逐渐暴露出来,数据中心需要更强大的算力,GPU、多元算力形态应运而生。影随算力多元化挑战,适应未来计算架构的变化,也是浪潮信息在努力的方向。开放计算,将有助于这一目标的实现。

在陈彦灵看来,不仅仅是OCP,只要是开放组织,任何单位或个人加入其中就可以共享技术资料,基于此进行开发,让这些技术普惠更多的行业企业,因此,更多的组织都在陆续推出。开放组织要主导特定的方向,必须有由大量的用户、厂商参与,以解决用户的需求、创造价值和推动产业发展为目标,这也是所有开放组织的使命。

叶毓睿补充说,近几年来,OCP逐渐称为一个“宽进严出”的组织,所有参与者都可以在这个舞台上扮演角色、分享成果,但所有的成果都需要其他成员的一致同意才能上升成为标准,而且这个标准是公开的、公平的,所有参与者都可以下载、使用和分享。

开放计算中国社区负责人叶毓睿

浪潮信息的开放计算经历了三个发展阶段。从2010年到2013年,主要是面向中国市场进行开放计算的探索,在国内最早研发OpenRack产品,深度参与天蝎项目,市占率达70%,产业规模第一;从2014年到2019年,浪潮信息全面拥抱开放计算,是全球唯一一家同时参与3大开放计算标准组织(ODCC、OCP、Open19)的厂商,主持和参与国内外多项开放计算顶级标准设计,生产和交付开放计算服务器百万节点;目前浪潮信息已经进入开放计算发展的第三个阶段,将继续提升技术创新、产品开发以及产业引领能力,引领国内外开放计算产业持续落地,通过建标准、建生态,推动数据中心高质量发展。

开放计算技术在向中小型数据中心和非互联网行业推广过程中面临着较大困难。陈彦灵表示,这主要是由于传统行业和互联网行业用户的应用模式和基础设施能力不同导致的。对此,可以让行业客户把一些开放“组件”先用起来,比如OCP NIC 3.0的网卡、关联的技术SAI等等,其次随着开放计算技术的逐渐标准化,浪潮信息也会探索出一套适合传统行业的标准框架,比如用标准服务器加标准机柜,来组合成一套可以满足部分整机柜特性的产品,来帮助传统企业提升算力应用的水平。

为什么达到一定体量后要做标准的制定者、在领域内拥有一定的话语权?

叶毓睿解释说,若仅作为跟随者,一旦新的标准出现,原先整套的研发设计体系,包括长期积累的资源有可能就会浪费,但如果成为一个引领者,这些研发资源都可以复用,能够降低生产成本,更快为客户所接受。浪潮信息一直积极牵头和参与开放计算标准的建立,这也是其服务器市场规模快速发展并保持领先的原因之一。

在OCP组织,浪潮信息重点开展了哪些工作?

叶毓睿举例说,以前服务器的管理模块和主板内嵌在一起,在计算芯片迭代时往往会受制于管理模块。而DC-SCM(DataCenter-ready Secure Control Module)将计算和安全管理进行解耦,降低了主板的设计难度,节省了设计和验证时间,有利于在计算层面主板的更新迭代和扩展,并且降低整机成本。浪潮信息于2021年12月加入OCP Hardware Management Module (硬件管理模块)项目组后,参与了DC-SCM2.0规范的制定与完善,在产品研发中对DC-SCM标准进行了设计实现,并在x86和ARM平台实现了DC-SCM标准的验证和实践。此外,浪潮信息还积极应用DC-SCM2.0规范中的新技术方向,进一步强化数据中心安全管理体系的建设。

去年OCP峰会上,浪潮信息曾经分享过关于服务器存储模块振动的研究与实践。风扇的噪音会影响硬盘读写性能和可靠性,为解决此问题,各个公司研发着各自的产品和技术,由于每个公司对存储、服务器发展的目标有差异,花了两年时间迭代出来的产品,如硬盘、主板、风扇、机箱等,组装起来时出现兼容性的问题,则需要重新设计。为此,OCP成立了相关组织,组聚集了行业内的一线研发人员,共同商讨对策,统一测量标准,开放设计经验,以期在硬盘容量、散热风扇并肩发展的趋势中找到新的平衡点。浪潮信息也参与到了这个全球的标准制定过程,并积极应用实践,不仅拥有OCP定义的3.5英寸HDDAcoustic Surrogate,而且自主设计了2.5”HDDAcoustic Surrogate,在采集振动的硬盘假体的应用中也积累了一些经验,可以进行各种服务器、存储机箱的噪声和振动信号分析,结合硬盘的敏感度曲线可以在研发早期进行有效的风险评估,并辅助机箱和风扇的声学优化和结构动力学设计。

类似的研究还有很多,如针对多核情况下的散热处理,CPU不带内存但通过CXL总线做复杂扩展,甚至针对未来计算模式、算力节点的发展方向等等,浪潮信息都有在针对性研讨,并且始终认定要通过标准来建设好,降低先进技术的应用门槛,普惠大众。

目前,浪潮信息已在多个新兴技术领域推动与开放计算项目的融合,促进整机柜、OAI/OAM、边缘、存储、网络、液冷等前沿应用和技术标准化与产业化。未来,浪潮信息将继续坚持开放、开源的技术路线,持续推动开放计算产业化,加速开源技术普惠。