数字经济时代,数据成为新的生产要素,数据的重要性不言而喻。随着数字化转型的加速,数据量正在经历爆发式的增长,根据IDC预测,全球数据总量将会从2020年的50ZB快速增长到2025年的175ZB,其中,中国的数据量更是将达到48.6ZB。爆发增长的数据量对承载数据的存储提出了新要求,不仅需要高性能、高可靠、高可扩展的存储介质,还需要自配置、自修复、自优化的智能管理能力。
近期,国际权威分析机构Gartner发布2021年全球主存储魔力象限报告《Magic Quadrant for Primary Storage》,华为存储继2016年以来,连续第六年入选领导者象限,报告中将智能管理能力作为华为存储的主要优势之一。
“华为主存储基于人工智能的三层数据管理系统,提供可视化跨栈管理,高效模拟和分析工作负载,显著简化基础设施运营,提升数据中心管理效率。” 【摘自Gartner 2021存储魔力象限报告】
华为存储如何实现智能管理能力的快速提升,其中又涉及哪些隐藏的黑科技呢?
首先,华为近2年推出三层AI运维架构,针对不同的客户运维场景需求,可提供基于云上云下协同的运维场景覆盖。
其次,基于存储服务等级SLA的自动化能力,支持全自动化、代办任务、脚本编排等多种场景业务变更。
再次,基于机器学习的可视化虚拟机、主机、交换机、存储端到端运维分析能力,在故障感知、故障处理方面实现被从动运维到主动运维。
最后,基于混合数据集成的检测技术和仿真评估能力,高效模拟和分析工作负载,帮助客户基于最佳实践合理规划和优化业务。
正是这四点黑科技支撑着华为存储智能管理能力快速提升,接下来一一解读。
三层数据管理系统联动,为存储提供智能运维架构
华为在十多年大量运维经验积累基础上,提出领先的“云端-数据中心-设备”三层AI运维架构,包括设备AI、中心AI和云端AI。其核心是充分发挥三层协同的优势,进而实现AI能力的全栈覆盖。特别是云端AI平台可以发扬其数据与算力优势,提供AI模型的训练,实现少人或无人参与的自治闭环。数据管理三层架构通过打通云上云下的协同能力,使存储自配置、自修复、自优化的智能运维管理能力成为可能。
基于服务等级存储池化融合,实现存储业务变更自配置
传统的IT系统多是烟囱架构,即单台或者多台设备物理上对应某一个特定的业务,不能灵活适配业务场景的变化。华为拥有全场景的OceanStor系列化产品,进而可以通过存储资源池化打破设备的边界,实现存储资源的按需发放。
数据中心存储场景,在对多存储设备基于SLA的池化整合后,存储IOPS、时延、容灾、备份等能力配置在SLA中,数据发放时用户只需指定业务所需的SLA服务类型,不再需要人工干预,主机、FC交换机、存储自动按照SLA参数自动化资源发放,大幅降低变更发放复杂度、人为出错几率和提升作业效率。
- SLA定义:按照容量密度定义SLA的IOPS能力,合理分配存储性能资源。
- E2E自动化能力:资源发放过程中,全自动化完成存储资源分配、交换机ZONE的划分。
- 资源自动推荐:按照容量均衡、性能负载均衡的策略为资源分配过程推荐最佳存储资源。
可视化跨栈管理,让存储运维从人工辅助转向自修复
面向存储系统,云端运维eService对业务Workload进行实时采集、学习,针对存储设备硬件配置、软件配置、性能数据等进行综合分析,评估设备性能压力,结合华为丰富的专家经验,精准地描绘出设备性能画像,准确识别设备性能瓶颈并给出相应的修复策略。
面向数据中心,中心运维DME提供虚拟机、主机、交换机、存储端到端的自动化故障发现和解决能力,依据虚拟机在存储子网中的拓扑关系,基于智能算法,可以准确识别虚拟机因资源争抢出现的扰邻现象,展示扰邻根因并给出解决措施,快速高效解决虚拟机性能问题。
- VM到存储的拓扑可视:可视化展示从vDisk到磁盘阵列的端到端拓扑图。
- VM性能异常检测:自动化识别VM的CPU、内存、时延指标持续偏高异常。
- E2E性能自助分析:客户可选择VM、Host、DataStore、LUN对象的CPU、内存、IOPS、带宽、时延等指标,进行对比分析。
- VM扰邻分析:针对主机内存、CPU、IO资源快速定位存储子网中异常VM存在的扰邻根因,针对性给出扰邻现象的解决措施。
高效模拟和工作负载分析,开启存储自优化之门
针对运维工作中最难、最易出错的业务优化问题,云端运维eService运维软件提供设备采购、业务上线、业务扩展和业务迁移四大场景仿真能力。
- 设备采购场景:支持自定义工作负载,评估设备性能能和容量,快速制定设备采购方案。
- 业务上线场景:仿真设备性能和容量变化趋势,合理规划业务上线目标设备,避免新业务上线因设备性能和容量压力激增导致业务故障。
- 业务扩展场景:仿真业务倍增时设备性能和容量压力,提前识别运行风险,保障业务稳定运行。
- 业务迁移:仿真业务迁移对设备性能和容量的影响,智能推荐迁移目标设备。
基于仿真结果,中心运维软件DME准确地预测业务变更后设备的性能、容量变化情况,主动进行业务优化,或者给出建议供客户,帮助客户实现资源最优化选择。
华为数据存储在运维管理领域将围绕极简、融合、智能打造自配置、自修复、自优化的数据管理软件,目前在金融、运营商、能源、医疗、教育等多个行业上百家大型客户得到广泛应用,并训练和积累数十种典型业务的Workload模型和大量存储优化算法。
在未来数字化转型的浪潮中,华为存储将利用在全球ICT领域技术储备的领先优势,逐步向高度智能化的变更、维护以及调优等运维管理模式演进,为客户提供最优存储运维管理方案,助力客户在数字化转型浪潮中脱颖而出!