不久前的感恩节期间,因为排班系统的失误,美国一家航空公司有上千架飞机无法正常起飞,原因是系统安排飞行员正常休假。这起由应用运维导致的典型事故,作为业务逻辑是无法预先发现、更难以预防。
Dynatrace大中华区总经理琚伟由此认为,业务已经复杂到无法人工胜任。
实际上,各行各业都正在经历数字化转型期,整个IT架构已经到了临界点。这逼迫企业打通组织之间的构架,通过监测和诊断复杂应用程序的性能问题,确保软件应用程序的良好运行,最终实现可管控的运维。
这无疑也成为驱动运维业务发展的要素之一。
作为应用性能管理(APM)市场的领头羊,Dynatrace市场份额接近20APM%,已连续7年被Gartner魔力象限评选为该市场领导者。
告别传统运维方式
有统计结果显示,平均每个单一交易可能使用到的技术为82种,而这些技术的排列和组合,将使情况变得更加复杂。
代码的复杂性、环境的复杂性使得人们疲于应对,除了系统监控和网络监控,企业不得不投资开发更多的应用监控。国内规模较大的企业,其核心应用更是数百上千。
在最近的一次采访中,琚伟表示,“从产品到设计,传统的运维方式已死,原因是绝大多数交付方式都是通过APP来实现,而后台由应用来支撑,这些应用决定了企业数字化经济的好坏。
对策是什么?
琚伟认为,必须把AI技术真正植入到运维中,用机器学习的方式去打通、去理解业务逻辑,打通交易链路,提前发现各种问题。
“AI是最理想的方法。”琚伟表示,像上述排班的失误,AI就能自动规避。更重要的是,这种自动监控让IT管理人员可以从业务运维的细节中抽身出来,重新评估现在的经济、环境,用更多的时间去研究自己的业务和创新,让每一个用户、每一个应用、每一个地点,人工智能全栈式、全自动化地运维方式和开发。
以往运维和开发是两个独立的团队,如今正逐渐融合,成为一个万亿规模的市场;运维也逐渐转向人工智能的运维(AI ops)和无人值守的operation(NoOps,而非没有人的operation),实现系统自愈。这种自愈系统将来在很长一段时间里会伴随着企业业务的发展。
将运维与AI相结合
AI的价值已经崭露,但业务运维如何去应用和实现?
四年前,Dynatrace就开始了布局——在奥地利设有实验室,开展AI相关方面的研究和搜集;在语音和车联网行业,Dynatrace在汽车之城底特律开展相关的合作。仅仅两年的时间,Dynatrace的解决方案从Pure Path这个单线跟踪技术发展到Smart Scope技术,再到拥有AI能力,并投入到实用过程中。
例如,将Dynatrace的OneAgent专利技术植入到数字经济环境中后,能自动采集所有相关信息,对信息相互之间的关系自动建模、借助大数据手段分析因果关系,最后将结果清晰地呈现给客户。
OneAgent技术的能力非常适合当今云的环境和数据中心。即使超过80种复杂技术也轻松应对。
人机对话方式是Dynatrace的解决方案的一大特色。如果显示异常情况,可以通过人机交互方式按重要性逐一了解到原因所在、影响到了哪些客户。
在上述航空公司,程序之间的关系多达840亿个,原有运维团队70人,采取8小时轮班制,借助30多种不同的工具,其MTTI(Mean Time To Identify),即从发现问题到确定原因的平均耗时,是55分钟。Dynatrace的AI解决方案每秒钟1000万次的处理能力,迅速找到并回溯到问题的根源,还提供了最优对策,实现了零告警。不仅如此,团队减少为7个人,MTTI仅为5分钟,所产生的效益无法估量。
除了上述案例,Dynatrace正在中国联通协助50多家全国汽车销售公司运维服务以以采集用户使用行为、优化用户体验方面,提供了一个全栈式IoT的解决方案;帮助星巴克将所有门店统一收回授权的过程中,将其后台各种系统,和星巴克自有系统实时整合在一起,实现了所有门店的单一应用、单一品牌与相同的客户体验。
与此同时,Dynatrace还不断加深与业界的合作。以公有云市场为例,Dynatrace的合作伙伴已经从Red Hat、AWS、Azure扩展到了华为、阿里以及ServiceNow等,这些公有云厂商既作为Dynatrace的用户,也借助云市场合作模式、借助用户的云应用拓展更大的空间。
运维界,AI的春天已来
虽然APM市场尚属于培育客户、挖掘需求的阶段,市场相对分散,展望未来,琚伟相信运维市场仍将保持50%的增长率。Dynatrace将继续加大投入,特别是对人才方面的投入。
琚伟认为,未来人工智能和芯片技术将成为中国两个最大的风口。借助于优秀的人才,以及以云计算、物联网、大数据的良好基础,AI将会走在其他国家前面。但未来最大的瓶颈是芯片,而芯片与实现AI的这些芯片的制造核心都不掌握手中。
因此,在维持传统的电信和金融行业优势的同时,Dynatrace将聚焦于高端制造。
这也是华为成为2016年Dynatrace单体最大客户的原因之一;2017年Dynatrace单体最大的客户则仍然是一家世界五百强制造企业。
高端制造业企业对计算机的依赖程度之高令琚伟惊讶,他发现,无论是电梯、空调、门窗等传统行业,还是汽车、航空航天等高精尖行业,他们都已经成为数字化转型的先锋,其速度和规模令人吃惊。
刚刚过去的2017年,在琚伟看来是“蛮有意思的”。他注意到,前两个季度,所有公司投资都非常谨慎。但从第三季度开始,投资速度明显加快。
琚伟认为,这得益于市场对数字化转型这种商业模式的认可,相关的产品和解决方案带来的预期价值刺激了用户尝试的积极性。
此外,很多新的创意往往是在经济欠佳、投资特别谨慎的时候“冒出来”。例如人工智能(AI),从年初被人热捧到年底不提人工智能都不好意思出门了。微软在英国伦敦剑桥大学的一家AI研究院,人均年薪达到34.5万美元,映衬AI的巨大市场与人才的巨大缺口。
对于运维界来说,AI的春天也来了。