AIOps是一种能力!你会为它单独买单吗?

AI有多火爆,从AIOps就可以领略一二。什么是AIOps?简单说就是AI+Ops,智能化运维。这一点和DevOps开发运维一体化颇为相似,DevOps诞生迭代、小步快跑的商业模式;那么AIOps能够带来什么呢?

从SoC、APM说起

SoC(Security Operations Center,信息安全运营中心)也好,APM(Application Performance Management,应用性能管理)也好,不说技术,这些概念本身也代表着需求,代表用户立项和采购需求。特别对于金融行业客户来说,非常重视SoC和APM建设。

华青融天就是在这样一种背景成长起来并在2016年挂牌新三板,其EZSonar、EZAccur等产品在金融行业用户中享有盛誉,前者针对应用性能进行监控和管理,后者针对安全管理的需要。

真正把APM、SoC做好并不是容易的事情。从网络流量进行抓包,解码到诊断、分析、告警,要求对于各种网络协议了若指掌,能够发现问题、解决问题,同时不影响业务系统的性能和稳定性。

2016年,华青融天已经把大数据、机器学习等技术应用到了EZSonar、EZAccur中,通过行为检测、机器学习等提高APM、SoC的IT运营技术水平。

AIOps会不会“有价无市”?

随着AI技术不断升温,AIOps这个概念被推到了前端。

据Gartner预测,到2019年,全球1/4的企业将策略性实施AIOps,战略性利用AIOps解决运维的问题,让工程师生活的更加美好!

不知大家是否注意到Gartner的表述:“AIOps让工程师生活的更加美好”,AI技术和运维工程师的经验进行结合,从而抽象并固化出来一套完整运维管理方法,的确可以大大提高效率,减缓运维工程师的工作压力。

从技术上说,AIOps 并不简单,需要大量的实践和沉淀。以快速故障分析和定位为例,银行用户往往会有几千个业务系统,每个业务系统故障触发的条件和阈值各不相同。从运维的角度,几千业务应用如何预警、如何展现?

采用AI方法进行异常检测时,运维人员不用对业务路径做任何告警设置,系统会自动实时检测交易流量数据,当机器学习算法检测到某个业务路径的某个节点或连线上产生了异常值,就会抛出异常事件。比如:算法在检测某个时间点上数据中心网银交易服务器的【响应时间】=500ms,而当前时间点的【异常值】=0.934,这说明当前服务器产生异常的概率非常高,需要及时对该设备进行排查,防止设备崩溃或产生异常。

运维可根据异常值的状态具体设置告警条件,也能够根据异常值在未达到警戒值之前就采取预防的措施避免事故的发生,所以AI方式的检测可以实现智能预警的功能。

实际上,这就是一种细颗粒度告警功能。此外,在场景化仪表盘、快速定位问题和解决问题,以及视觉设计,组建自动维护等环节,AI技术的运用能够帮助运维人员提高数据中心管理的效率。

这些新的技术应用演进,以及功能性提高在新的EZSonar 4.0中得到了体验,从而让产品更加具有核心竞争力。

但是从商业的角度,AIOps应该只是APM产品能力的升级,它是运维人员不可或缺的工具,但是AIOps暂时不太可能替代运维管理人员,此外,故障和异常毕竟还是小概率事件,所以从这个角度来说,AIOps暂时还不能完全取代SoC、APM产品功能,

不过已经是当前的前沿趋势了,如果没有AI功能的植入,肯定不能称之为是智能化的IT运维了。

小结

对于AIOps来说,AI的价值不应该仅仅停留在运维上,价值也不仅仅是降低运维人员的劳动强度,对于AI来说,就有点大材小用了。无论是SoC,还是APM,实际上掌握和拥有全部业务数据,如何发挥这些优势,支持业务创新,洞察市场、趋势和发展,这才是AIOps未来的潜力市场所在!,

一句话,金融反欺诈、个性化金融服务等业务创新,与AIOps密切相关,价值决定未来的市场空间,对吗?!