一提到灾难我们会直接想到美国的"9·11"事件,它给美国众多公司带来巨大的损失。在这场灾难中有50%以上的公司倒闭,仅有6%的公司幸免于难,而导致公司倒闭的最大原因就是信息的流失。可以说,数据是现代企业正常运转的重要依据和企业发展的宝贵资源。如何确保数据安全成为了企业是否具有核心竞争力的体现,对保险行业更是如此。但是,人们对容灾还长期存在着许多误区。究竟什么是容灾?怎样合理规划企业的容灾系统?面对业界推出的各种容灾解决方案应该如何选择。
容灾不仅仅是技术
容灾,就是减少灾难事件发生的可能性以及限制灾难对关键业务流程所造成影响的一套行为。容灾的目的和实质就是保持信息系统的业务持续性。
容灾是一项系统工程,它涉及到管理、流程、规范等各个方面,而不仅仅是技术。容灾不光指简单的数据备份和恢复,还包括系统的或者业务应用上的恢复,其中数据备份是容灾的基础。
容灾等级,按国际标准 SHARE 78分成七个层次:第0级-本地冗余备份、第1级-数据介质转移、第2级-应用系统冷备、第3级-数据电子传送、第4级-应用系统温备、第5级-应用系统热备、第6级-数据零丢失;按国家标准分为六级:第1级-基础支持、第2级-备用场地支持、第3级-电子传输和部分设备支持、第4级-电子传输和完整设备支持、第5级-数据实时传输和完整设备支持、第6级-零数据丢失和远程集群支持。
从技术上看,衡量容灾系统主要有4个指标:一是恢复点目标(RPO),二是恢复时间目标(RTO),三是网络恢复目标(NRO),四是服务降级目标(SDO)。不同的场合对各项指标都会有不同的要求,需要根据具体的情况进行综合考虑,找一个平衡点。其中,RPO和RTO是最经常使用的两个指标。
保险业容灾建设两大难题
随着许多企业实施业务系统大集中,针对IT系统的高可靠性和容灾能力的需求日渐突出。然而,目前大多数容灾系统建设还存在诸多问题,不仅有技术层面的缺陷,也有流程和人员方面的不足。这些问题可能导致的直接后果就是当灾难发生时,根本无法实现应用系统的快速恢复,甚至可能导致业务运转的长时间灾难性中断。
一是容灾意识有待进一步加强。有关人士剖析国内保险公司的信息安全观时曾指出:"保监会对全国的保险企业作出了数据容灾的规范化要求,但国内企业对此并不重视。和国外同类企业相比,中国保险业不仅在容灾、备灾的意识方面较为落后,投入方面更是远远不够。"、"当前,有些保险公司抱有侥幸心理,认为灾难离自己很远,为此大量投资有些得不偿失"。
二是容灾建设方法应进一步完善。目前,虽然大部分保险公司都开始重视起灾备系统的建设,陆续完成了基本容灾系统的IT基础架构建设,但如果没有相应的灾难恢复计划,也没有针对灾难发生后的应对、决策、详细的灾难恢复步骤,容灾系统将难以发挥真正功效。
保监会在2008年3月21日颁布了《保险业信息系统灾难恢复管理指引》(以下简称《指引》),为保险公司加强信息安全基础设施建设、推进信息系统灾难恢复工作起了重要指导作用。
保险业容灾建设的几点建议
1.统筹规划容灾。各保险公司必须认真做好风险分析和业务影响分析,明确信息系统的灾难恢复总体目标,确定信息系统的最低灾难恢复能力等级要求。而目前的一个现象是:很多保险公司在启动容灾系统建设的时候,考虑的不是业务上的实际需求,而是一开始就想做一个高等级的方案,这样的方案会导致预算比较高,董事会或管理层就会觉得做容灾系统是一个很费钱的事。
容灾系统应该具有三个层次,包括了主机的高可用系统、备份系统和整体系统故障异地容灾。但是国内的许多企业在做异地容灾的时候,都只重视第三个层次。前两个层次能够有效地屏蔽掉单点故障等局部故障问题,在整个容灾系统中也起着重要的作用。
实际上,做容灾系统并不见得一定要花很多钱。如果充分考虑了公司的业务需要,选择一个恰当的恢复等级,这时候公司花的就是按需定制的钱,投入也会比较合理。这是保险公司需要买什么样"保险"的问题。
2.按需建立容灾系统。保险公司的容灾系统与银行相比,有自身的特点。保险公司的数据恢复时间不像银行要求那么短,容灾系统的级别相对就低一些。现在有些保险公司走入了一个误区,在建设容灾系统时动不动就做实时的。除非保险公司的电子化程度非常高,在线投保是保险公司的主销售渠道,否则,建立实时的容灾系统是一种浪费。另外,保险公司容灾系统的共享性比银行要大得多,完全可以由几个保险公司共享一个容灾系统,这样对保险公司来说会大大降低建设容灾系统的成本。
《指引》的第四条,介绍了灾难恢复建设的三种模式:第一种模式就是自建。就是自行出资建设并拥有灾备中心,目前我们国家大部分机构都是这种方式。第二种就是共建,就是多个机构共同出资建设和拥有灾难备份中心,为参与单位提供灾难备份服务。第三种就是外包,也就是指选择外部资源来承担或者协助完成信息系统灾难恢复的规划、实施、运营维护,以及应急响应和恢复工作。应该说,外包方式是当前国际上灾备市场的主流形式。据统计,国外采用灾难备份外包服务的比例已经达到71%,灾备系统外包得到国际上的广泛认可。
因此,根据自身的业务需求,选择哪种灾难恢复建设模式,明确容灾系统要做到哪一级最低灾难恢复能力等级要求,这是涉及到投入与产出的关系,也是各公司最为关心的问题之一。这是保险公司怎么样去买"保险"的问题。
3.灾难恢复是系统工程。据专家分析,各企业上马灾难恢复计划仅是做了保险工作的第一步,而能否在灾后正确、顺利地实施才最为关键。灾难恢复是一项系统工程,只建项目是不够的,项目内容应该包括灾难风险评估、业务影响分析、灾难恢复策略设计、详细方案设计、容灾方案实施、灾难恢复计划开发以及最后的灾难恢复测试和演习等。
非常专业的容灾系统建设指引和检查流程,是项目得以顺利完成的重要因素之一。其中,保险机构灾难恢复组织机构的建立,是项目能否成功的重要保证,其在灾难恢复规划、实施和运营维护阶段以及在应急响应和恢复阶段都担当了主要的职责。容灾演习是对容灾项目建设是否成功的检验标准,也是容灾维护管理流程和文档检测的重要手段。通过定期举行灾难恢复演习,一方面可以及时发现操作流程中可能出现的问题,另一方面使每次演习后员工能对灾难恢复工作的了解逐渐加深,并有助于培养员工的应急处理能力。
灾难恢复建设并不是一劳永逸的,《指引》指出:"保险机构应持续开展灾难恢复工作,以保障灾难恢复策略、灾难备份系统和灾难恢复预案的适用性"。"灾难恢复的需求应定期进行再分析"、"保险机构应根据灾难恢复策略定期复审和调整灾难恢复技术方案、灾难恢复预案,并定期开展灾难恢复预案培训和演练工作"。只有这样,保险公司买的"保险"才能真正发挥其保障作用。