浅析基于ITIL的云计算运营支撑系统建设

1.概述

在过去的几年时间里,云计算成为了IT界最为热门的技术之一,我们身处对于云计算的摸索及实践的螺旋式发展中。特别是在2010年,云计算在IT市场上异军突起,上升为最具战略意义的IT理念。市场分析师和权威媒体已经预测:在未来的5年内,世界上绝大多数公司将采纳云计算作为其基础运算架构。

2006年,谷歌推出了“Google101计划”,并正式提出“云”的概念和理论。随后亚马逊、微软、惠普、雅虎、英特尔、IBM等公司都宣布了自己的“云计划”。今天,认识并应用云计算已经成为企业和政府把握市场脉搏的必修课。在云计算的产业中,各大电信运营商都摩拳擦掌,试图凭借网络、服务、用户的优势,占据产业链中最核心的部分。

互联网技术和虚拟化技术的高速发展为云计算的实现提供了充分的技术储备和应用需求。在经历了集群计算阶段和网格计算阶段以后,发展到了今天的云计算。从技术上来总结,云计算是SOA架构的延伸,是虚拟化技术的扩展,是分布式计算技术的演进,它为现代社会带来了信息存储、处理和使用的工业化革命。

云计算是一个新兴的商业计算模型,是当今信息化社会孕育出的一种资源虚拟化、系统透明化、软件服务化的全新商业计算服务模式。通俗来说,利用高速互联网的传输能力,将数据的处理过程从分散的计算机或服务器移到互联网上集中的计算机集群,这就是云计算的计算模式。透明(Transparency)、按需分配(On-demond)、伸缩性(Scalability)、自动化(Automation)是云计算的最本质特征。

正是由于云计算的诸多优势,因此成为了运营商关注的重点。各大运营商纷纷上马了云计算的项目,力求在云计算领域能拔得头筹。但由于云计算是一种新的 IT资源提供模式,它将数据,应用及其他资源,以服务的方式通过网络提供给用户,新的服务模式为企业提供了更加灵活的IT解决方案,但同时,运营商如何为企业提供高效的运营支撑成为了企业能否成功将实施云计算策略的关键。在结合了云计算自身特点的基础上,我们将ITIL的理念引入到云计算运营支撑平台的建设中。ITIL以流程为核心,给出了在IT服务过程中应该按照哪些流程来维护管理IT系统,从而提高服务水平。从的业务发展形势来看,ITIL更加符合当前电信转型的需求。基于ITIL规划设计云计算运营支撑系统,在提升IT服务质量,降低IT服务成本,协调IT服务部门内部运作的基础上,开发优质的个性化增值服务满

足客户需要。

需要指出的是ITIL它并不是一套理论模式,它所根据的是最佳的实践经验,是经验的总结。其中的许多经验不但广为人知,而且被众多IT机构采用来提升 IT服务的效率及加强IT部门间的横向沟通。目前这套最佳时间已经经历了时间的考验,被证明是被IT业界广为接受的一套经营IT经验指南,是IT管理的业界事实标准。

ITIL虽然是IT领域的服务标准,也就是说它并不专注于电信领域。但随着电信企业的纷纷转型,电信企业越来越多的把目光投向了IT服务领域。电信企业的网络、系统为用户提供通信服务,当用户服务中出现问题热线进行投诉或者是咨询时,热线就具有了ITIL定义中的服务台(ServiceDesk或者 HelpDesk)的功能。而服务热线对客户的投诉、需求进行登记,并进行初步的判断,再决定将用户的投诉活需求向第二线或者第三线的支持团队递交。后台支撑团队处理网络故障,尽快恢复用户的通信。这个过程相当于ITIL中的事件管理,支撑团队通过对多起相关事件的分析发现了引起网络故障的根本原因,就是问题管理,然后通过变更管理和发布管理来更改网络或者系统的配置,从根本上解决问题。以上过程同维护IT系统的过程非常相似,因此对电信网络的维护和管理完全可以采用ITIL中的流程来执行。

3.ITIL理念在云计算IT系统中的应用

3.1总体结构

构建新一代的以ITIL理论为基础的云计算运营支撑系统,将满足运营商对云计算业务运营支撑需求。系统从事件发生到妥善处理并达到与客户协议的服务水平,形成了一整套完整的可计量的闭环服务体系。该运维管理系统充分体现了ITIL的以服务为核心、以技术和平台为手段的服务管理思想。

运营支撑系统总体规划构架图如下图所示在实际建设中,我们按照规划设计,遵循ITIL的IT服务管理思想,进行逐步实施。在接下来的章节中,将介绍云计算运营支撑系统中几个关键模块的设计。

3.2关键模块的设计

3.2.1配置管理模块

配置管理:维持准确、一致和可靠的基础架构信息对服务的成功执行和运作有特别重要的意义。配置管理就是管理和及时提供准确可靠的云基础架构配置信息,使得云提供的服务拥有有效的资源。配置管理的实施,可以迅速的了解变更所带来的影响,更快速有效的执行变更,对IT服务管理实施来说,是必不可少的关键一环。从总体规划的结构图就可以看出,配置管理是其他流程的基础。在实际的系统建设中,我们是在资源管理的基础上建设配置管理模块的,应该说,CMDB是资源管理模块的升级。首先,配置管理模块管理的范围更广。传统的资源管理模块只管理到了物理资源及部分的逻辑资源。资源管理对物理资源包括机房、机架、设备、端口等都进行了管理,但对于逻辑资源就管理得不够全面,包括IP地址、设备配置可能还进行了管理,但对于诸如软件版本、servicepack安装情况等,就没有管理到了,所有与云基础架构配置相关的内容都需要纳入配置管理范畴。

其次,配置管理对被管理对象管理的深度更广,重点加强了对被管理对象之间的关系的管理。实务经验显示,其实配置管理中只有20%是资料,剩下80%是被管理对象之间的的关系。对于配置管理,我们必须解释CI及CMDB这两个配置管理中最重要的名词:CI是ConfigurationItem的缩写,就是被管理对象。IT环境内使用的所有组件,包括软件、硬件、程序、文件等都可以当做是一个CI,它可以是整个系统,也可以小到是某个小硬件组件或软件模块。CI层级(CILevel)的制定决定了管理的粒度,是配置管理会议手册及论文集程序中相当重要的成功关键因素。CMDB是 ConfigurationManagementDatabase的缩写,里面储存CI所有的相关数据,以及CI与CI之间的关系。

从事件、问题、RFC,一直到变更被核准及建置到上线系统中,都是由CMDB串连起来。每个CI应该要记录哪些信息呢?这就是CI的属性 (Attribute)。其中应该要包括名称、版本、产品型号、地点、负责部门、供应厂商、RFC编号、变更代号、事件及问题编号、目前状态、供应日期 (指的是自供货商收到的日期)、接受日期(指的是通过验收或测试的日期)、目前状态等等。CI状态可能包括订购中、修理中、储存中、丢弃、安装等。

3.2.2服务台:

服务台是IT服务运作(SO)最直接的工具。服务台对整个IT服务管理而言起到非常关键的纽带作用。服务台以客户为中心为实现业务目标提供高质量的 支持服务,降低提供和使用IT服务的总体成本,提高用户满意度,协助发现商业机会,优化支持服务的投资和管理,为业务、流程和技术的全面变革提供支持。服 务台的日常活动包括需求管理,报告、审查和反馈等。

服务台(ServiceDesk)是用户和IT服务组织或者说是服务提供者的中心联系点。为IT管理人员和IT客户访问提供唯一界面,这里指的IT 客户可以是外部的客户,也可以是组织内部的客户。它通过一个集中和专职的服务联系点促进业务流程与服务管理基础构架的集成。它是协调客户和IT部门之间联 系的桌面平台。

ITIL所提供的组织架构是把支撑团队划分为一线、二线、三线多层次支撑体系;一线人员记录服务的呼叫,并处理简单故障,一般指的就是服务台;二线人员处理一线解决不了的问题;三线人员解决难度较大的问题。

服务处理的流程结构如下:

传统的服务台是用被动的方式来运作,每当有事件或警告发生时,等待客户通报再来响应。现在比较新的观念且现今技术上也可以做到的是,IT内发生的事 件可以在它们直接影响使用者及顾客之前被侦测到,或是事件发生时马上警告支持人员。在云计算运营支撑系统中实现的系统监控功能就可以实现这些功能。系统通 过部署的探头周期性轮询系统各组成部分,可以对网络设备的负载、流量,主机设备的负载、应用运行情况、进程健康状态等进行实时监控,在发现系统出现异常 时,及时发送告警到监控服务器。服务台在获知这一信息后,及时通报内部支撑团队做出响应,这样做不仅能够更加准确的定位故障,及时修复,更缩短了响应时 间,极大提高了客户满意度。

在云计算运营支撑系统建设过程中,我们利用了Web技术为ServiceDesk提供服务一个很好的管道。基于Web的集成服务台真正能够有效地简 化工作流程和交流,通过集中的系统来过滤所有的提问和请求可以更好地进行控制。它还使企业或机构能够方便地捕捉到信息,整合成一个在线的自助系统。建立了 客户自服务系统,是云计算服务的门户网站,通过在线自助服务将使企业能够发展多级服务和支持操作。例如,客户可以通过服务门户自助创建工单,它给予客户自 行解决问题的功能和工具,减轻了高成本的HelpDesk技术人员工作压力,从而有利于解决需要特别留心的更为复杂的问题。在线自助服务还允许客户提交问 题,并跟踪这些由HelpDesk管理员来解决的问题。从整体上看,在线自助服务降低了支持成本,并提高了运维人员的生产效率和客户满意度。它还使得企业 能够全天候7*24小时地为客户提供服务。

4.结束语

以ITIL为指导建立的云计算运维支撑流程管理体系,需要从企业实际情况出发,考虑组织架构、管理体制等现实状况,将国际规范最先进的技术和管理理念灵活运用到企业管理中的体现,为云计算等电信转型业务的发展奠定良好的技术基础。