基于AI的智能基础设施,春天在路上

企业存储提供商正在拥抱AI和机器学习以此创建支持AI的智能基础设施。每家供应商产品的重点和成熟度各不相同。其中一些专注单个阵列的运行状况,与预测分析相比,更多地依赖于故障数据。其他家则专注于应用级别的性能和可用性。两种方法都为客户带来了极大地益处。

结合预测分析和主动支持改变了存储的用户体验。通过前瞻性支持实施预测分析的供应商为客户避免了数百次重大的服务中断问题。因此,消除了与宕机时间相关的直接成本和声誉损失。

而对更具远见的存储提供商而言,预测分析的最终目标不仅仅是消除宕机时间,而是使基础设施能根据客户的优先级进行自动优化,以提高应用的可用性,性能和TCO。

这些智能基础设施可以自动执行常规基础架构管理任务,以及追踪,解决然后解释应用性能问题原因的耗时开销。因此,智能基础设施能让IT员工将精力集中在创造新业务价值的项目上。

嵌入式AI VS 基于云的存储分析

一些存储提供商正在将AI芯片嵌入存储阵列或将分析功能集成到存储OS上。两种方法都可以直接在阵列上运行分析。这种方法的优势包括能够实时调整以提供最优应用性能,并将许多混合工作负载安全地整合到单一存储系统上的能力。

其他存储阵列供应商从整个已安装集群中收集故障和遥测数据,并在云上输入数据运行AI/机器学习。遥测数据包括与工作负载,前端端口,存储池等相关的IO/s,带宽和延迟。基于云的一个优势是可以对从整个安装集群中收集的数据应用预测分析和机器学习算法,然后利用该分析来识别每个阵列的潜在问题和优化机会。

可视化需求

当基础设施平稳运行时,重要的是要能够向各个利益相关方证明已满足SLA。当问题出现时,对基础设施的可见性就变得更加重要。基础设施分析可以极大地加速根本原因分析并加快问题解决速度。

基于分析的可见性还可以帮助用户进行容量规划,从而使基础架构能够逐步满足性能要求。容量规划所涉及的不只是推断趋势数据。随着企业机构寻求从其数据和IT系统中获取更多价值的同时,他们向数据中心添加了新的工作负载。

现在,一些存储供应商提出可以对环境中添加特定工作负载的容量和性能影响进行建模的分析。可以确定最佳的工作负载位置,是否需要升级,并确定满足SLA所需的特定升级。

人工智能和取代人工的重要性

在评估数据中心基础设施产品的AI/机器学习功能时,企业应寻找能够利用AI/机器学习来自动化基础设施管理的产品,但人们可以根据特定于站点的优先级(最好是基于粒度)优先选择这些产品。

毕竟,当关键业务应用没有获得应有的优先级时,您通过基础设施获悉的最后一件事是:“对不起,臣妾做不到!”

Dell EMC PowerStore包含一个自主智能引擎,能根据可用容量,硬盘磨损等因素自动执行初始卷放置。PowerStore还通过预估“容量用尽”日期并建议批量迁移计划来辅助容量规划。Dell EMC还包含了基于云的CloudIQ与PowerStore支持计划。

新华三的InfoSight智能运维系统来源于其收购的Nimble Storage,InfoSight为基于数据,遥测,算法和数据科学基础为基础设施提供成熟服务,而且支持离线可视化。其基于云的AI平台使用机器学习预测,并且预防了86%的可能发生事件。跨堆栈分析让基础设施可视化性能达到虚机级别。新华三目前在在其所有数据中心产品中集成了InfoSight。

华为OceanStor Dorado 8000 V6和Dorado 18000 V6存储系统采用专有Ascend AI芯片,能动态优化许多的应用性能。还提供专注于阵列健康的云分析。

Pivot3 Dynamic QoS根据工作负载的业务价值提供基于策略的QoS管理。系统自动应用一组默认策略,并动态实施这些策略。不过管理员可以更改策略并即时更新将哪些工作负载分配给每个策略。

Pure Storage Pure1 META提供跨堆栈分析进行快速的原因分析,并提供复杂的工作负载建模促进容量规划。

Tintri在自优化分析框架上构建了Intelliflash Analytics。提供对存储系统的数据,虚机和实时性能分析的洞察力。Tintri VMstore将智能分析功能嵌入了其存储操作系统,使用这些功能来动态管理每个工作负载的性能,无需人工干预。

此外还有国内的先智数据,基于自身的Federator.ai产品提供多云环境下的次日运营( Day 2 Operation。简单来说就是当你完成初期的设施搭建,配置,测试并实现运行后,再对平台进行绝对优化,监视利用率,确保其可用性和成本优化),着眼于运营自动化和效率。

构建基于AI的基础设施是IT企业转向真正数字化要走出的第一步,从投入应用到开启竞争局势,产品不断智能升级再到普遍应用,还需要很长一段路要看。