在IT运维管理过程中,没有故障的网络是“理想化”的,尤其是在大型网络中,甚至会出现多起网络故障同时报修的情况。当多起运维需求同时被提交时,IT运维人员往往会面临如何处理优先级的问题。
中国是个讲人情的社会,这种特殊化的交际结构,是国内企业永远不可能绕开的话题。而职场上说到的“人情”,往往含有最基本的两层意思。一种源于亲缘,另一种源于同感。亲缘强调的是“熟人”,常被人当成是一种“私情”;而同感主要指同事、上下属之间的相互理解和体谅,强调人性化的处事方法。在故障处理级别设定的问题上,IT运维管理同样也会受到“人情”的困扰。若不能正确处理“私情”和“同感”的区别,往往就会让IT运维服务处于极其尴尬、被动的局面。
我们来看看一个IT运维中的实际案例。小李是某集团网络中心的资深工程师,他时常会遇到业务部门或者下属公司同时申报网络故障的情况。为了摆明自己不讲私情的立场,小李采用了“先报先修”的流程来处理申报,但这种自以为公正的方法却仍然遭到了投诉。更为严重的一次,由于集团核心业务系统没有得到及时修复,导致整个网络中心受到公司高层的通报批评。难道说“先报先修”不对吗?
针对IT运维管理过程中出现的类似问题,小李请教了国内领先的IT运维管理专家北塔软件。北塔软件专业人员为其解释:“在传统的IT运维管理模式中,运维工作本身不具备透明性、信息不对称,这是屡遭投诉和批评的主要原因。‘先报先修’看似合理,但却没有考虑到故障恢复的优先级,也就是故障的影响度、紧急度。因此,最佳的处理方案,首先就是要实现设备层面的主动运维,减少故障率;其次,就是要在这个基础上,形成业务层面的运维服务管理,签订并履行SLA协议。“
一般来说,在同时需要处理数个故障的情况下,由于受时间、资源和人力等的限制而无法实现时,就要排定处理的先后次序,即确定每个故障的优先级。但出现故障后,没有哪个用户会同意滞后处理。相反,他们总是认为自己的问题才是最需要优先解决的。因此,最好的IT运维方式,是建立透明化的运维平台。这非常像马路上的电子屏幕,用绿色和红色表示畅通和拥堵,通过透明化的方式,为IT部门和业务部门建立一个共同关联的平台进行交互。
以北塔软件的北塔BTIM综合业务管理系统为例,利用北塔BTIM的数据采集层、数据处理层和功能显示层,可以充分对IT基础设施进行透明化管理,将一些看不到摸不着的IT资源,通过清晰直观的方式展现和管理,以便于管理人员对IT系统的现状做到准确的把握,在服务可能出现停滞之前就发现先兆并采取相应措施。
另外,为了帮助企业建立有效的SLA协议机制,北塔BTIM中包含“业务仿真”等功能,以及巡检服务,可以帮助IT部门寻找可能导致违背SLA承诺中的性能问题、WAN延迟和业务缓慢的难题,按照业务访问的路径,关注业务路径中一切的元。其次,北塔BTIM还支持了从网络流量中剥离出关键业务的实时业务流量,进而投射到网络拓扑结构中,让业务用户的分布,各网络节点对业务流动的影响“一目了然”。一旦出现预警和故障,即使多么复杂的异构环境,都能为快速恢复业务的正常运行建立分析机制。
签订SLA之后,IT部门可能会得到一些前所未有的好处,但如何让非IT部门同样受益,实现同感呢?对此,北塔软件表示:“如果只是以列表的方式把参数展现出来,还是无法满足信息对称的要求。为此,用户可以使用北塔BTIM报表功能,将业务系统健康状况、整合参数、外联参数等数据‘翻译’成业务人员和领导看得懂的图形。对于业务部门而言,由于存在这个透明的管理平台,就可以清晰的构建业务架构的质量。而领导层也可以看到这些关键业务的健康状况,好还是不好,下面的员工满意还是不满意。”
如此透明化的IT运维管理,在科学处理故障的同时,就已经屏蔽了可能由于“私情”和不理解产生的协作矛盾,让IT运维管理可以进入到合理、有序的新进程。