袁绍龙 发表于:14年09月26日 14:00 [原创] DOIT.com.cn
近年来,银行因为IT系统故障而中断业务的事故频发,大到工行、交行这种大型,小到重庆农商行、宁夏银行这样的城商行,都不可避免地出现了业务停顿的故障,一时间针对金融行业的灾备建设又成为热点话题,人们纷纷探讨金融行业故障频发的原因,是管理不善造成的“人祸”还是产品解决方案的不足,一时众说纷纭。赛门铁克近日表示,像城商行、农信社等地方银行在灾备建设方面除了需要选择合适自己的技术与解决方案外,后续的运维管理亦非常重要,地方银行更需要将自发式运维变成主动式运维,从而才能将容灾建设完善。
地方银行灾备需做到合理规划
相比于四大行拥有多年的IT建设经验不同,地方银行由于地域、经济水平、发展规模等原因,导致其IT建设水平也是参差不齐,尤其是在容灾建设方面,其实是存在着很多不足的,加上地方银行一直受限于预算和IT人员水平等因素,使得地方银行往往不能走四大行的灾备建设路线,而是需要寻求适合自己的灾备建设路线。
赛门铁克华西区技术经理叶永军就表示:“地方银行虽然没有四大行那样的规模,但是在系统应用的复杂性方面并不会降低,而且业务数据量也非常大,涉及的IT应用和环境的种类也非常多;另外一个现实情况就是,地方银行在IT人员水平和经验跟四大行的确有较大的差距。”
与此同时,银监会对于地方银行在IT建设尤其是容灾建设要求并不低,已经有明确的政策规定了地方银行在容灾建设必须达到的各项标准。“银监会对于地方银行是有很多监管要求的,银监会《商业银行数据中心监管指引》的要求,例如在商业银行取得金融许可证后,设立生产中心,生产中心设立之后两年内建立灾备中心;总资产如5000亿以上规模的银行的必须灾备5级以上等。”叶永军表示。
图一:《信息系统灾难恢复规范》,对于地方银行而言,容灾建设的第一个目标即是达到4级标准。
从《信系统灾难恢复规范》可以看出,标准级别越高对于业务和数据保护越好,当然也意味着IT投入会越高。地方银行在财力和人力方面无法跟四大行比拟,不过也是必须达到四级标准。叶永军表示:“银监会对于银行的容灾建设标准有硬性规定,比如千亿规模的必须达到五级以上,而地方银行则必须达到四级标准,四级标准就是周期性地把数据复制到灾备中心去,而五、六级则强调实时性的数据复制。”
在叶永军看来,国内很多地方银行的IT成熟度跟大银行差距巨大,应该做好相应的灾备建设规划。“很多地方商业银行连基本的备份都没有,或者说仅仅是利用小机上带的免费备份工具。对着这些商业银行而言,最方便、快捷地就是建立先建立四级容灾,先做好集中备份,然后按照容灾要求把数据放在远端,这样就可以满足要求又改变原来备份不成熟的状况。”叶永军补充道。
赛门铁克认为满足地方商业银行容灾四级要求很好的产品是备份一体机,通过备份一体机将用户的备份容灾架构简化,通过一个设备即可将灾备所需要的包括硬件、软件、网络、存储等配置一步做好。
图二:赛门铁克通过备份一体机实现四级容灾,通过简化地方银行生产中心的备份架构,以及周期性地复制数据到容灾中心里满足四级容灾的需求。
“根据调研显示,当前80%的备份与恢复出现的相关问题都是人为操作的问题,例如不会操作或者误操作造成的损失,通过备份一体机实际上是将以前需要人为操作的事情封装好,通过即插即用的方式可帮助用户构建一个备份体系。对于地方银行而言,IT运维人员较少、且经验缺乏你,备份一体机其实非常适合这些商业银行在起步阶段构建容灾体系。”叶永军表示道。
随着我国经济水平的稳步增长,地方商业银行也在迅速成长,商业银行已经呈现出跨地域、多领域发展的趋势,随着地方商业银行规模的变大,对于其容灾建设的要求也在稳步上升,也开始寻求五、六级容灾标准的建设。
图三:赛门铁克基于主机卷/文件的数据复制技术满足商业银行的五、六级容灾建设的需求。
叶永军认为:“五、六级容灾有两个关键技术,首先就是数据怎么复制,业界有很多关于这方面的技术,从IO到应用,再到存储路径都可以做,赛门铁克在主机卷、存储层以及数据库层面做数据的远程复制,虽然现在有些数据库也带有远程复制的功能,但是它只能复制数据库的数据,且操作相对比较复杂,并不是一个完整的方案。赛门铁克的主机卷方式灵活,可以不同在不同的网络实现同步复制和数据零丢失。另外一个关键技术就是怎么实现数据切换,赛门铁克拥有一个知识库,拥有5000多种特征,可以提前帮助客户规避,在出现故障的时候保障切换率。”
图四:赛门铁克的容灾应用切换管理。
叶永军表示:“像金融行业应用系统比较复杂,业务间的关联度和依赖度也较高,不是生产中心停了,灾备中心启动就可以了,业务之间是有顺利和逻辑关系的。赛门铁克可以自动调整这种业务的逻辑关系,以自动的方式实现切换,并且通过赛门铁克容灾切换管理工具还可以在事先发现问题,规避切换失败。”
图五:赛门铁克华西区技术经理叶永军
总体而言,现在针对数据中心的容灾技术呈现出多样化的趋势,一些非常具有特点、改变传统灾备概念的技术逐渐受到了用户们的关注,比如最近几年比较流行的双活数据中心技术,可以随时来回切换改变了过去传统容灾中的“主”与“备”的概念。对此,赛门铁克华西区技术经理叶永军表示:“从业务部门的角度来看,双活的确是更好的选择。从目前技术发展的级别来看,双活存在很多级别,比如基本级别是做到数据库层面的双活,这非常常见。还有就是把业务人为的分成两个部分,一部分放在A中心,另外一部分放在B中心,互为灾备。这其实跟传统的主备没有区别,只是跑了一半业务,但是还必须为了保证故障切换留够足够的性能余量,不能满负荷跑应用,满负荷则切换不回来。从投资的角度来看,双活并不节省成本,双活这个概念很好,但是技术成熟度还没法做到随意切换。”
另外,CDP技术也是多年以来比较热门的容灾技术,其记录每个IO变化的功能保证了用户可以回退到过去任意时间点,因为这些特性也收到了国内很多银行用户的关注与采用。叶永军则表示CDP技术适合轻量级应用,当应用规模上去之后,很容易形成瓶颈。他表示:“CDP技术不太适合IO性能频繁的应用,只适合IO轻量级的应用。”
主动式运维很重要
不可否认的是,对于用户而言,在灾备建设过程中,除了选择适合自己的技术与解决方案外,关于容灾项目的后续运维与管理也非常重要。赛门铁克就认为用户需要从自发式运维向主动式运维转变。叶永军表示:“赛门铁克会给地方银行的所有应用系统基于丢失的影响进行分级,所有的应用都必须按照相应的级别来做保护,从全生命周期开始就是这样。另外,像现在城商行对于应用上线之后的考核关注并不多,而赛门铁克是能够帮助用户实现运维的监控、比如备份的覆盖率、备份的成功率、恢复的成功率、恢复演练的成功等等,这样可以帮助用户从自发式运维向主动式运维转变,通过指标提升知道还存在哪些缺陷和不足,即使是一些技术方面的不足,也可以通过管理和手工的方式进行弥补。所以,整个容灾其实是应该向应用生命周期的前期和后期推进,上线前做好标准,上线后做好考核。”
叶永军最后也谈了当前国内容灾备份市场的竞争情况,尤其是当前国内一批本土厂商随着技术和产品逐渐走向成熟与完善之后,国内容灾备份市场的竞争必然回走向激烈。对此,叶永军表示:“容灾其实是一项经验积累性的领域,技术门槛相对还是很高,赛门铁克过去遇到的问题比后面的竞争对手多的多,所以赛门铁克在容灾备份领域的经验是最丰富的。”