从桌面实际切换演练 引领灾备演练新趋势

从灾难恢复演练的方式和内容看,演练可以分为桌面演练、模拟切换演练和实际切换演练等。原来,银行、证券、保险、电力等行业企业进行的灾备演练多是桌面演练或模拟切换演练,真正进行实际切换演练的企业凤毛麟角。现在,大连银行、北京银行、浙江电力等一些灾备领先企业都已开始进行实际切换演练,并且,有实际切换演练需求的企业也在迅速增加,实际切换演练正在成为一股流行趋势,被众多企业所接纳。

灾备演练的分类及价值

对于已经进行灾备建设的企业,时常面临以下困惑:业务系统更新、调整后,原有的灾难恢复预案是否仍然有效?灾备系统是否已经有效更新?真正发生灾难需要启用灾备系统时,灾备系统的切换时间是否可以满足业务的恢复要求?系统切换流程、步骤是否有遗漏和错误?如何在不影响业务的情况下完成系统回切,并保证系统和数据的完整性?灾备演练对于检验灾难恢复预案的适用性、有效性,提升灾备系统的实际恢复能力具有重要意义。

从灾备演练的方式和内容看,应急演练可以分为桌面演练、模拟演练和实际切换演练等,这几种演练形式侧重点各有不同:

桌面演练,采用场景模拟、分组讨论、头脑风暴和专家点评等形式,对可能发生的灾难情景进行应急反映和应急处置;主要参与人员根据灾难情景假设,表述自己的反映行动,并对应急响应及灾难恢复期间的组织架构、职责分工、协同工作、处置行动等内容进行纸面或口头的表述和测试。

测试演练,是指针对灾难备份系统中重要单元和关键子系统进行灾难恢复功能测试。灾难备份系统测试演练可以在变更发生后、模拟演练前或定期进行,以检查关键业务、关键系统、关键数据的可靠性和可用性。

模拟切换演练,在保持生产正常运行的基础上建立模拟演练环境,基于信息系统恢复预案和业务恢复预案进行模拟的系统切换和业务恢复演练;用于对灾难恢复系统、业务恢复环境、灾难恢复预案、业务恢复预案及各恢复团队进行能力的检验。

实际切换演练,在设定的灾难场景下将业务处理切换到灾备中心及业务恢复环境,并在完成系统恢复和业务恢复后由灾备系统及业务恢复资源提供对内对外的业务服务,实际切换演练期间的业务处理由灾备系统和业务恢复资源提供,原来的生产环境可以进行必要的系统维护或为灾备环境提供备份支持。

几种演练目的各有不同,比如,桌面演练主要用于检验应急响应预案和灾难恢复体系的完整性和有效性;使相关人员了解应急响应及业务恢复流程;全面验证技术及业务管理指挥、流程操作、协调配和等方面的综合能力;完成相关人员的意识和知识技能培训;验证客户在灾难中应急响应和恢复能力;提高企业在灾难发生时IT部门和各业务部门的应急响应能力等。模拟切换演练可以比较真实的检验灾备系统的可用性、有效性;检验灾备系统和灾难恢复预案是否可以满足业务恢复的需求和业务连续性的要求;可以在很大程度上使参与人员熟悉灾难的场景,工作任务的执行过程和组织协调方法;使一旦发生灾难时,相关人员可以清晰、冷静地根据模拟演练所得到的经验和积累进行相应的灾难恢复工作。实际切换演练能最大程度地对灾难恢复及业务连续体系进行检验。

第一批吃螃蟹的人

由于实际切换演练过程本身的复杂性、高风险性以及服务中断对社会的不利影响等原因,大多数企业进行的灾备演练都是桌面演练和模拟演练,真正进行实际切换演练的企业并不多,主要集中在银行、证券、航空、电力等行业。

大连银行是较早进行实际切换演练的企业之一,为检验同城灾难备份系统和灾难恢复预案的可用性和有效性,使全行相关人员熟悉应急管理和灾难恢复流程,保证在灾难发生时能够采取正确、有效的应急管理,大连银行于2009年10月,组织信息科技部、各业务部门以及各分支行进行了全行业务的实际切换演练,并取得了圆满成功。

同样进行灾备实际切换演练的银行还有北京银行。2008年5月,北京银行组织在京各支行、异地分行和总行对包括核心主机系统、银行卡系统、中间业务平台、支付密码系统、报表系统、财税库系统、汇票密押系统、人力资源系统、储蓄国债系统、信贷系统、Swift系统、TI系统、办公自动化、门户网站主页、后督系统等15个系统进行了实际切换演练。

浙江电力是电力行业中较早进行实际切换演练的企业之一。2008年初,浙江电力对电力SAP(电力企业信息化系统)和OA(办公自动化系统)系统成功进行了非计划停运事件应急响应演练,其中包括系统真实切换演练,该演练完整地验证了容灾系统在突发情况下对电力生产中心电力SAP和OA系统运行的接管能力。

大连银行、北京银行、浙江电力等企业通过实际切换演练充分检验了灾备系统、灾备中心的适用性、有效性,验证了灾备切换技术操作文档的完整性,提高了技术人员对应用系统远程切换和回切操作的技术熟练度,使相关人员熟悉和掌握按灾难恢复流程进行灾难预警、灾难宣告、通知通报等应急处理流程,提升了灾难恢复和业务连续恢复能力。