金融行业‘震痛’后的灾备建设处方

金融系统的IT系统不仅承担着对公、储蓄、增值业务、账户管理系统、征信等关键业务的运营,而且具有各类扩展业务、OA、数据、决策支持等各类支撑子系统的运行,系统的不间断运行能力对于维护和谐社会、提供优质服务、进而在激烈的市场竞争中立于不败之地具有极其重要的地位。而确保核心业务系统能够持续运转的核心就是建立强大的容灾体系以抵御、防范各类风险。目前,各商业银行已经将灾难备份的目标提高到很高的层面,而且在业务恢复的等级上都具有在各行业中比较高的恢复指标,这些灾备标准往往涵盖极小的数据丢失指标和极为快速的业务恢复能力指标。

技术定位及采用对于灾备体系的成功,起着极其重要的作用。为了满足全面的灾难防御要求,实现高标准的灾难防御指标,同时避免出现国内常发生的容灾备份体系建设之后,仍出现“有灾无备”的现象,美国飞康公司所提出的基于IPStor技术的CDP(连续数据保护技术)灾备方案,往往能获得高效、全面、高标准的新的灾备标准

美国飞康公司是国际上知名的虚拟存储技术软件公司,最早成功地将虚拟化技术结合数据连续保护及存储优化等领先技术,提出了功能强大、开放、性能出色并面向未来发展的CDP灾备解决方案,不仅实现大型灾难的业务恢复体系,而且实现了各类人为错误的瞬间恢复机制,这使得用户由单一技术同时解决硬件故障和数据逻辑错误的愿望变为现实,这在各类容灾技术中是非常独特的

目前在各商业银行的业务系统中,IT系统所受到的威胁不仅是各类自然灾害等大型的站点级威胁,更多的则是来自于系统内部的各类自身运行威胁。例如:

存储单元的保护缺失:虽然已经建立了基于集群方式的高可用集群,但这一体系只能解决主机系统的安全问题,存储系统本身的安全性还是一个比较薄弱的环节,一旦存储系统故障,双机体系则立刻失效,业务系统可能出现停止运行的情况。

历史数据版本的瞬时备份及恢复:一旦出现数据丢失或系统受到破坏,采用传统的备份系统无法帮助管理人员立即恢复到正确的状态(RTO时间过长),应急能力极弱,同时存在数据不可恢复的风险。因此,备份、恢复的各项指标急需进一步提高,特别是数据备份的实时性亟待提高,以提高对数据安全的保障能力。目前,虽然各类信息系统都建立了备份系统,但是根本无法对这类常见故障提供及时和快速的恢复和应急机制。我们经常可以见到一旦数据库系统因故障停运,其对于整个系统会产生巨大的杀伤力。

有些人认为,采用传统的灾备方式,也能立刻化解以上各类风险。事实如此吗?其实不然,传统的灾备方式在这类常见的“杀手”面前,完全束手无策,因为他们忠实地实现了一个标准的机制,而错误也在传递和克隆,错误仍会杀伤到灾备中心。

美国飞康公司的IPStor CDP容灾方案,是专为金融领域的IT系统设计的一套行之有效的,集磁盘镜像、数据备份、数据远程容灾于一体的多点综合容灾解决方案。其基本架构为:

1.在各生产中心配置一台IPStor CDP数据保护管理器,通过FC/iscsi方式连接到现有的生产数据库服务器上。这一连接不影响生产数据的原有路径,不影响原有的磁盘阵列连接。

2.IPStor CDP数据保护管理器,均通过数据抽取工具实现生产盘到IPStor CDP的Mirror机制,实现生产数据的同步提取。

3.生产中心的IPStor CDP数据保护管理器配置256份快照/生产卷的快照模块(TimeMark),实现多历史点保护。

4.生产中心的IPStor CDP数据保护管理器将提取的生产镜像盘通过Replication的机制实时复制到远程容灾中心。

5.远程容灾中心设立一台IPStor CDP管理器,连接到容灾中心的磁盘阵列上,与生产中心实现数据的传送。容灾中心的IPStor CDP数据保护管理器同样配置256份快照/生产卷的快照模块(TimeMark),实现多历史点在容灾中心的保护。

6.远程复制的策略根据实际的传输带宽情况灵活制定。带宽充裕则可以设定为连续模式(同时可配置成为时间间隔的快照方式,通过时间间隔在远程形成照相点,采用TimeMark模块),带宽较窄则建议采用时间间隔增量的方式进行。

7.故障时,如需灾难恢复,只需提升容灾中心IPStor的对应空间即可。

8.如果生产系统出现人为的错误,需提取数据进行查询或纠正错误,只需对远程对应的快照瞬间可用即可(这一过程5分钟即可完成)。

9.美国飞康提供了两端磁盘系统的差异比较机制,容灾系统随时可以进行各类容灾备份演习,比如利用容灾中心启动验证某类业务接管后的正确性,并且在容灾备份演习结束后进行各种方向的还原(如容灾备份系统同步生产系统或生产系统同步容灾备份系统等),具有很大的灵活性。

飞康公司的CDP 本地/异地数据保护系统的设计思想将容灾系统建立在一个更高更完善的层次。设计目标和效果涵盖以下方面 :

灾备系统防御范围涵盖“软”“硬”等灾难种类

信息系统在运行过程中可能出现的故障和危险主要存在以下几类:

* 主机系统故障

* 存储系统故障

* 数据库系统无法启动/数据库表丢失/数据库文件丢失

* 文件丢失

* 人为导致的系统错误(如黑客、数据删除等)

* 计划内系统升级

* 自然灾害、设施故障、停电等 针对主机系统的故障,如果配置了双机热备系统,往往能够实现一定程度业务连续。但是,存储系统的故障将使这一切努力化为乌有。根据国内各行业尤其运营商的历史统计,存储系统故障导致应用宕机的情况往往经常发生。因此,容灾体系建设中,存储系统的安全性保障及灾难方案是重中之重。飞康新型CDP灾备解决方案,首先做到了针对存储设备的致命故障确保业务立即运行,使系统具有对存储系统故障的免疫能力。

需要强调的是:常规容灾建设中,往往只关注硬件故障或基础设施部分的故障概率,忽略了发生概率很高的数据丢失以及人为失误造成的破坏,使“有灾无备”的现象屡屡发生。实际上,传统容灾技术手段均忽视了这类“软”错误的防范。

例如:当生产中心错误发出一条删除指令时,容灾中心的数据也将被删除。

常规容灾技术此时只能利用传统的备份手段来恢复,而您可能不得不面对长时间的系统恢复、部分数据不可恢复的风险、复杂的恢复过程等诸多不利因素。

因此,飞康新型CDP灾备解决方案将同时解决“软”、“硬”两类灾难作为整个系统设计的第一目标,完全克服了各类传统容灾备份体系的这一弱点,保障业务的连续运行、提升系统安全。

容灾和备份的一体化解决方案

常规容灾系统建设中由于技术的局限,大量采用容灾复制的方式再追加传统的磁带库备份方式,这种组合方式考虑到了对各类灾难的抵御,但由于传统备份软件和设备的限制,以及其无法按照灾备指标进行衡量的弱点,使用过程中多不理想。

飞康新型CDP灾备解决方案即将容灾与备份合为一体,确保在任何灾难(包括数据损坏需要恢复历史数据时)发生下的快速恢复能力,在灾备理念上达到了一个新的起点,保障了方案的创新性和先进性。

开放式容灾系统,无硬件等技术限制

这一条件使得用户在设备选型时拥有了完全的自主权,能够大大降低设备的采购成本,不会再为不可选择的专用设备的高成本而发愁了。

有效保护OA系统

针 对OA系统的灾难保护体系,是一个十分令人头疼的事情。生产系统的灾备体系往往无法延伸到OA系统的保护层面。目前,各商业银行中,OA系统的防护仍停留 在备份的比较落后的层面上。美国飞康公司的CDP容灾方案针对OA系统的防护提出了专门的解决体系,这就是任何邮件服务的损失在5分钟内实现恢复,OA服 务器的瘫痪,在5分钟内重新运行。这几个关键点的出现,彻底打开了OA系统防护体系的大门,使得灾备技术出现了飞跃。

针对数据库的数据一致性保障机制

数据库系统的容灾备份体系中,不仅要同步存储的数据块,而且数据库高速缓存中的数据必须与数据库文件的数据保持一致性刷新。以上所有内容均完成远程同步后,才能确保灾备站点的正常一致性启动。

常规容灾技术分类中均无对高速缓存数据的处理机制。飞康新型CDP灾备解决方案提供的数据库代理,确保了数据库的快速恢复和一致性,在技术上具有相当的先进性。

灾难发生时的极快速恢复能力(RTO)

恢复能力的高低是容灾备份体系的重要指标,具体体现在重要的RTO指标。只有快速的对于各类故障的恢复,才能够确保业务的持续运行。飞康新型CDP灾备解决方案的一个核心思想就是瞬间恢复的理念,将恢复的能力提升到一个很高的高度。体现在:

* 生产中心础设施故障,容灾中心启动飞康专用设备,业务恢复时间<10分钟

* 生产中心存储设备故障,生产中心的飞康专用设备立即接替运行,业务恢复时间<10分钟

* 生产中心数据丢失,利用生产中心或容灾中心的飞康专用设备实现快照恢复,数据恢复时间<10分钟

* 。。。。。。

你可能惊叹这一结果,但这就是CDP为我们带来的多重保障,任何灾难都将不再是困扰金融行业业务运行的致命因素。

对容灾传输链路的最小占用

带宽是灾备体系考虑中的一个瓶颈,传统的容灾技术多为宽带技术,往往不能适应现有的传输带宽。

飞康新型CDP灾备解决方案中,拥有独特的专利技术MicroScan(小单元传输技术),辅助压缩的传输模式,能够将传输带宽的利用率提高400%以上,这样,从宽带到窄带的各种条件下,都能够完成容灾复制的任务。

我 们在传统的金融系统灾备建设中,经常可以看到一个业务的灾备体系就已经占用数百兆甚至千兆的远程带宽,而新增业务往往有需要等同的带宽保障,可以说某些灾 备技术为金融系统的低成本运行带来了不小的负担,往往得不偿失。这一切,在IPStor CDP技术中,你会发现完全不同了,IPStor CDP技术往往在现有的各类带宽上就具有了极强的适应性,哪怕你只有2M的带宽。

多种系统连接方式(FC、IP/iSCSI)

一个开放的容灾系统应保证各类主机的接口,应该应对各类应用系统的接入。

飞康新型CDP容灾技术,提供了基于FC的连接和基于iSCSI的连接,甚至于提供了SAN/IP的独立IP连接协议,因此全系统的各类服务器体系今后都可以加入到容灾体系中,真正实现了大容灾的架构。

满足经常进行容灾、备份演练的要求

容灾备份演练是整个容灾备份系统得以准确、有效应用的必要保证。为确保容灾备份体系在故障应急时的准确运行,容灾备份方案应能在平时提供各种容灾备份演练机制。

飞康新型CDP灾备解决方案允许使用方在容灾中心可以随时提取任何快照,进行数据验证、流程验证、报表查询、压力测试等,甚至于将容灾中心进行演练后,还可以随时差量反向同步到生产中心,这样你就无须担心很多容灾系统的数据一致性隐患,可以组织良好的应急响应流程和团队。

工程实施期短(1天),对生产影响小(2小时)

飞 康新型CDP容灾技术重点采用了专门的初始化工程技术,利用飞康公司的小型便携CDP专用设备,可以轻松实现生产数据的迁出和向容灾中心的迁入,而且,由 于飞康公司提供了Scan Difference的在线差异比对技术,这样甚至于无需停机,既可以完成初始数据的迁出,这是任何其他的容灾备份技术所无法实现的。

容灾、备份系统的易管理和易维护能力

容灾系统的维护管理非常重要,如果运维的难度过大无形中会导致项目成本的增加。常规容灾系统的维护量相对较大,维护相对复杂。

飞康CDP有友好的图形化操作界面,能够在单一画面上完成所有节点的配置工作和容灾系统的管理。一个控制台能够统一的管理所有生产中心和容灾中心的飞康专用设备。

飞康CDP灾备解决方案的易管理能力大大降低了容灾备份管理的门槛,有利于用户对于系统的突发事件做到及时响应,降低维护难度和维护成本。

总之,飞康的CDP灾备解决方案一经出现,其卓越的最为全面的灾难防护能力往往难以令人置信,但是体验过这种新的灾备技术的人们,他们的内心只有赞叹,因为,他们看到了灾备技术的新的高度。