对于上海期货交易所来说,有的系统每年维护费是几千万元,而有的系统一年大概也不会超过一百万,为什么会出现如此大的资源分配差别?
实际上,任何一个机构、任何一个地方,资源都是有限的,如何确保有限的资源投到最正确的地方,长期以来一直都是困扰各企业CIO最头疼的问题。
合理的资源分配不仅是IT建设标准的问题,更是一个涉及制度层面的问题,一旦二者可以同时得以有效解决,意味着一个企业的信息化建设经验将从一种隐性知识转变为显性知识,从而真正地融入到企业的创新内核中去。这便是上海期货交易所与惠普技术服务团队合作建立风险分级保障体系的初衷和由来。
建设初衷
交易系统是期货交易中最核心的业务运营系统,作为资本市场重要组成部分,期货交易标的物数额巨大,且变动迅速,全球联动以及杠杆放大,一旦发生任何系统问题,都不是小问题,因而要求交易系统能够稳定、高效的运行。
这样一个典型的行业特点也决定了IT部门必须承受更大的压力,上海期货交易所的IT团队为此常常需要让自己处于一种临战状态。然而,让他们感到困扰的是,一个偌大的交易所内部的信息系统也异常庞大,整体的日常维护和建设需要投入大量的人力、物力及财力。在这样一种情况下,如果所有的事情保障等级都是一样的,资源的分配根本无法做到全盘兼顾,势必影响到整体效率。
上海期货交易所从2003年开始到2008年一直在做技术上的更新换代,在建设过程中,越来越急迫地发现,在有限的资源基础之上,根据事情的轻重缓急调配资源,既能高效地保证核心业务系统的稳定运营,又能兼顾其他重要性相对低一些的业务系统的运维需求。建立一个全生命周期内的分级风险保障体系,对于上海期货交易所来说,已势在必行。
李大鹏博士是上海期货交易所首席技术官兼技术管理委员会主任,他曾是纽约商品交易所信息服务首席架构师,回国后还一直担任中国证监会STEP工作组副组长。作为上海期货交易所主要信息系统建设的领导者和技术监督者,他非常熟悉风险防范体系的出台始末,为记者作了详细介绍。
实际上,在系统的完善和维护过程中,李大鹏博士与他的核心领导团队还发现了一个问题。现有的IT团队中的骨干在基础设施上尤其是在最关键的系统方面,已经积累了一些独特的经验和心得,可是这些知识只存在于各自的头脑里,能不能将其固化下来,转化为显性知识以供更多的人分享,从而形成一种IT建设或服务层面的制度,也是要亟待解决的问题。
“2008年12月,我们开始进入相关策划、调研和验证阶段”,李大鹏说,2009年4月份开始展开招标工作。由于惠普很早就参与了上期所新一代交易所系统的建设,对于内部的业务流程和管理已经相当熟悉,并且帮助交易所梳理了最佳业务模型,制作出了一整套的业务模型说明书。另外,惠普解决方案及专业服务涵盖了与客户IT基础架构相关的方方面面,尤其在风险管理、保障业务连续性等IT治理方面具有一定优势。因此,综合考量各个方面的因素之后,上期所最终决定再次与惠普合作,共同打造一个全新的风险防范体系。
四级风险保障体系
2009年6月15 日,惠普技术服务团队开始进驻上海期货交易所办公大楼,10月28日,由惠普实施的《上海期货交易所技术系统分级保障体系咨询项目》完成验收。
一个IT的项目从构思开始,就可能形成 A、B、C不同的方案,方案不同,成本不一样,投入也不同。那么,最终实施某一个方案的认证标准到底应该包括哪些内容,实际这些标准就决定了将来的风险保障级别。保障级别体系越高,难度越大,决定了维护和建设的成本越高,同时对于最终这个系统使用的约束条件肯定越多,限制也更大。保障级别低的情况,相对给予的保障有限,成本也就越低。
这个体系的实施,就如同IT部门与业务部门之间有了“契约”的基础,从业务部门提出要求、立项之日起,即确定了新应用的风险防范级别以及它所对应的成本支出。这种“契约”的思想贯穿到开发、运行的整个过程。IT要为业务部门提供什么服务内容,要达到什么样的服务水平,“责、权、利”划分得更加清晰。
基于上海期交所业务框架和开发管理框架,并结合惠普在IT基础架构及数据中心相关的解决方案架构、步骤和方法,该风险保障体系建立了四级风险应急机制,实现了从立项、需求、设计、构建、测试、发布、运行的全生命周期风险防范。
根据李大鹏的描述,上期所按照重要性和可用性两个维度,在100多项指标基础之上,共分为了四个保障级别。一级系统当中目前包括交易系统和长期发布系统,无论对交易所的声誉、形象和投资者利益来说,它们都是很重要的。二级系统典型的应用有很多,但影响面没有一级广泛,重要性也没有一级高,例如结算系统和交易所网站系统等。结算系统为什么很重要?因为最后结算出来的文件是有法律效率的,这一块数据直接影响到整个市场的安全运行。典型的三级系统主要是所内应用的系统,它跟业务很有关系,比如风险监控系统。虽然无论是技术监控系统还是风险监控系统,采用的技术模型都跟交易系统一模一样,因为是所内应用系统,可靠性和影响度都要下降,所以就定成三级系统。第四级系统是期交所内内部管理系统,如邮件系统、办公系统、HR系统等。
上海期货交易所技术中心首席技术总监严少辉在这基础上作了更具体的解释,在他看来,分级保障体系定义了一个框架,“哪些系统应该落在哪一级里头,这是跟业务部门和领导商量好的”。一旦定好了级别,从开发开始、测试、上线、运行和后面的维护都立刻会跟上,其中包括资金投入、人员分配以及相应管理水平都将实现一种优化配置。
另外,还可以形成一种高优先级带动低优先级运营保障制度。举个例子,如果开发一个监控系统,最早可能会设定在一级、二级,一旦技术开发成熟以后,很自然的会延伸到三级、四级里去。从而在运维经验和水平上能形成一种内部的带动效应。
契约管理机制
有的时候,技术和管理是矛盾的,需要平衡。
由于需要同时平衡技术和管理在保障当中的作用,国内还没有一个企业试图去尝试建立如此完成不同阶段、全生命周期风险管控的体系。上期所的这套分级保障体系在上海期货交易所内部IT部门与业务部门之间好比形成了一份“契约”服务协议,让IT部门与业务部门之间的服务更透明和易于量化管理。
既要提供高保障的技术系统,又需要合理的分配资源,日益扩展的技术系统和技术复杂度也对IT技术带来了新的要求。惠普企业业务集团技术服务部基础架构服务中国区总经理潘伟炯表示,“上期所的分级保障体系是一个创新的项目。惠普采用了自己的企业架构、步骤和方法,合并了三个成熟的管理框架,最佳实践理论,最终形成了一体化的保障体系。”
整个保证体系分为技术、运行和开发三大框架,对期交所的业务做了明确的划分。技术框架确立了从机房、网络通讯、主机存储到数据库应用和可靠性模型的静态技术标准。运营框架则明确了对运维动态指标的管理。开发框架则是指开发活动里的指标管理,比如资源的配置,相关的容量、切换、监控等非功能性要求的定义等。
潘伟炯进一步阐释了他的看法,“IT的需求和业务的需求通过沟通获得整合,体现了互相的承诺。分级模型和分级保障体系的确立,为IT的需求和IT服务的对等关系提供了契约的基础,使得IT服务的产品化成为可能,有效推动了IT建设服务化的进程,从而保障了体系的制度化”。
技术要求或实施标准是一个高保障体系所需要的关键组成部分,同时一套高效的管理流程可以在机制上实现服务的承诺和保证。上期所内部技术实施和管理是分开的,其中技术公司和技术中心分别负责核心系统的开发和日常的运营,而技术管理委员会实际上是一个监督性的机构,所有跟技术相关的立项,方案的审查,保障级别的设定以及项目结项等等工作均由该委员会决定。
上期所从技术服务框架和管理机制上进行了双重设定,李大鹏认为,“本质的目的在于完善技术和业务之间的沟通,使双方的承诺完成向契约化的进化,这也是契约论的精神所在。”
在今天的环境下,IT管理需要新思路,重塑IT价值。制定分级保障体系是把技术管理固化成一种模式,从管理水平中消除了人为因素,形成业务和IT契约理论的双方之间的制约和激励,这正是上期所的信息经济学。