浪潮信息主导开放计算项目新进展公布 为数据中心智能化运维奠定基础

随着数字经济的到来,算力成为未来行业发展的重要因素。海量数据的产生让数据中心的工作负载变得越来越复杂多变,对硬件性能和效率的要求也更为严格。在此背景下,浪潮作为全球领先的计算解决提供商,开始致力于开放基础设施的建设,并为企业和用户提供综合的解决方案,以应对全新的挑战。

日前,由浪潮牵头成立的开放计算项目OpenRMC有了最新进展,OCP社区公布了OpenRMC Design Specification v1.0(开放整机柜管理设计规范1.0版本),对整机柜的北向管理接口进行了规定,初步明确了设备管理中信息采集范围、数据呈现方式及采集模块的硬件部署选项,为整机柜统一管理提供参考架构,也为进一步实现数据中心的智能化运维奠定了基础。

“开放计算,title=“开放计算””/

OpenRMC是基于开放的设备级管理控制器,对整机柜内各类设备固件运行状况进行收集和控制。其中,以机柜内设备的BMC芯片为边界,分为南向管理和北向管理,南向管理通过BMC所连接的部件,收集服务器内部的硬盘、电源状态、电源功耗数据;甚至包括架顶交换机等机柜设备的工作状态信息;北向管理则以统一的规范呈现出收集到设备工作的信息,形成了一个标准化的用户界面和管理方法,并计划未来满足安全、加密技术及资源池化等新业务的需求。

在本次公布规范1.0中,规定南向信息采集的物理设备包括机柜内电源、风扇及服务器内部部件等;采集的信息包括各节点序列号、机柜及节点电源状态(电压、电流数值)、电源开关状态信息、节点温度、节点运行状况(CPU、内存、LED)、告警日志、固件版本、远程固件刷新及服务器FRU信息;RMC管理规范对信息采集模块的硬件部署也进行了推荐,可以部署在电源分配单元、架顶交换机以及服务器节点作为专属RMC管理控制台。    在北向的数据呈现方式上,OpenRMC与下一代数据中心管理标准Redfish融合,通过浏览器即可呈现服务器各类数据,相对于二进制的显示方式更加友好,同时也可以进行固件远程刷新,方便运维人员操控。为此,浪潮高级技术总监郭洪昌表示,管理的第一步首先要统计口径一致,通过定义北向和南向规范,把读取的数据格式和参数进行统一,让用户能够在一个界面实现所有整机柜的管理。目前OpenRMC能够控制固件更新,未来将实现远程开关机,在线离线热插拔部件,打通从数据采集、读取、呈现到控制的各个环节。

为了满足数据中心的整体运维需求,浪潮还构建了物理基础设施管理平台 ISPIM,提供资产统一管理、设备实时监控、告警精准推送、设备自动巡检、无状态固件管理、智能能耗分析等功能,实现数据中心内部服务器、存储、网络设备统一智能监控运维。

目前,各行各业都在关注5G和AI的发展,5G和AI等新技术应用的落地却离不开开放计算。因为开源软件和开放硬件正在不断融合,正在改变着全球IT产业分工协作模式。作为OCP、Open19和ODCC全球三大开放计算标准组织的共同成员,浪潮一直在为开放计算的发展努力,并不断推进AI技术产业化创新。