智慧运维(AIOps),是将机器学习算法与基于大数据的业务运维管理工具整合,在告警过滤、异常监测、自动修复等环节发挥效用,可以将IT人员从繁复耗时、容易出错的基础运维工作中彻底解放出来,专注于更有价值的业务运维。AIOps不仅可以节省IT人员的时间、提升效率,更重要的是提高判断准确性,减少误判。Gartner在2016年时便提出了AIOps的概念,并预测到2020年,AIOps的采用率将会达到50%。AIOps目前在国内外领先的互联网企业开始被逐渐应用,也是近年来国内外被普遍看好的技术。AIOps平台未来将逐步取代现在的运维监控、管理工具和自动化运维产品,成为各类IT系统必备的运维组件,对一级资源池这样设备规模巨大的重要IT基础设施更是具有重大意义。
思特奇多年前就开始投入对AIOps产品研发,完全掌握了人工智能和运维体系下的技术和产品,具备自有知识产权和持续研发迭代升级、服务的能力、机制和团队,分别在2018年、2019年获得TMF最佳孵化器奖和年度卓越奖。
思特奇智慧运维分析系统,以人工智能技术为核心,使用tensorflow、spark、hadoop、mysql、kafka等开源软件作为基础组件,支持云化部署。
采集中心——提供统一采集能力,对设备、应用、服务、日志、业务等数据进行全量的抽取和存储,并通过制定数据标准和ETL工具统一数据模型,为AI分析提供数据基础;
AIOps能力中台——封装通用的算法和模型,提供智慧运维敏捷开发能力,以提升开发效率、评估模型效果及规范管理;
业务实现层——围绕效率提升、质量保障和成本管理的典型场景,进行能力工具集的建设。
思特奇成立26年来,成功实施了上百个IT运维平台项目,在项目建设过程中积累了丰富经验,并形成一套自己独特的流程机制和保障措施,思特奇AIOps平台经过多年的深入研发与实践,产品成熟,目前产品功能完善,得到了用户的广泛认可。在政企、运营商等行业有大量落地场景案例。
某省电信-工单流程智能化:构建智能化工单预处理,面向IT故障、问题,通过预处理实现信息补全、初步诊断,自动派单,提升运维效率。处理后的故障形成规范化知识条目,以智慧能力向报障渠道输出;已经接入主要工单流程,针对工单流程的“处理时长”和“处理震荡”两个维度分析,找到电信部门中哪些部门、哪些人、哪类工单处理效率低,针对流程执行过程的瓶颈点进行针对性优化。
某省联通-告警收敛:解决海量告警轰炸,将多个告警事件收敛成较少的告警事件,解决冗余问题,提高获取告警信息的效率,并帮助运维人员从大规模告警信息中判别故障根因。已经全面接入SaaS、Paas和IaaS相关告警,最近一个月总共产生告警96209条,告警压缩后为39467条,减少告警56742条,减少告警量58.98%,压缩比41.02,极大降低无效告警的数量。
某省移动-数据库操作异常检测:平均每天采集240多万条SQL执行操作日志和近100亿条调用链日志数据进行关联分析。从系统上线运行至今,一共检测优化1651多条异常SQL,发现39个异常数据库账号并发起账号处理流程,保障生产系统的稳定运行。
某省移动-智能运维机器人:替代一线值班重复高频且无技术含量的工作,解放人力来执行更多需要人工参与来提升工作质量的工作,可以通过开发智能运维机器人来接管总控目前负责的如监控、通报、变更单录入、日报发布等标准化流程化的工作,实现监控异常自动通报、自助咨询问答、变更单报备自助录入、日报自动统计发布并可进行投诉工单智能处理等工作。
关于思特奇
北京思特奇信息技术股份有限公司(以下简称:思特奇;股票代码:300608.SZ)成立于1995年,是中国IT行业发展和变革的积极参与者和贡献者,是国内领先的ICT(信息通信技术)基础设施及软件产品、行业解决方案和服务提供商。思特奇致力于自主研发、科技创新、场景应用、价值运营的融合发展,打造开放、共赢的生态合作体系,助力行业客户与合作伙伴实现数字化转型、智慧运营和价值提升。
思特奇以成为云、大数据、万物互联、人工智能和智慧运营时代,产品、技术、服务、运营的可信赖专家为宗旨。立足行业,持续创新,掌握并充分应用5G、AI、云计算、大数据、物联网、区块链等新一代信息技术,为政府、企业、消费者提供包括电信业务支撑、智慧城市建设、数字经济转型、中小企业云和智能服务、智能制造和工业互联网运营与支撑、AI-PaaS、云和大数据一体化运营等系列产品服务和解决方案,并广泛应用于政府、电信运营商、制造业、商业、金融、能源等行业,以科技助力数字化转型,创造美好生活。