安全管理:灾难恢复管理得失论

随着数据中心虚拟化程度的加深,资源迁移更加灵活快速,其对传统灾难恢复(DR)方案的需求也就随之降低。在本文中,DR专家Paul Kirvan谈及了虚拟化和数据中心整合对灾难恢复管理的影响,以及一些容易被遗忘的事项。

虚拟化是否让灾难恢复管理更加容易,抑或是反而增加了复杂度层级?

Paul Kirvan:在主要的虚拟化厂商的产品和服务中,灾难恢复扮演着重要的角色。在理想化的虚拟环境中,数据中心的必要性将不复存在。你只需租用数据中心,然后通过PC上的浏览器就可以开始工作了。

如同其他系统迁移工作一样,如果要进行虚拟化改造,你必须确保软件得到了相应的保护和备份。为了保护虚拟化投资,你需要确认虚拟化厂商在灾难恢复方面的专业技能,并促使其作出承诺。此外,还要让厂商们做出这样的保证:你现有的技术在虚拟化环境中同样可用。

无论是与诸如增值经销商之类的第三方厂商合作,还是直接同大型的PaaS或IaaS厂商签订合同,你都必须规划好灾难恢复的方案。对于一个管理虚拟化环境的CIO来说,已经不能仅仅关注自己这一部分的灾难恢复功能,还必须把所有相关环境的灾难恢复方案一并考虑进来。

那么,关于灾难恢复功能,CIO们应该怎样和厂商进行协商?

Paul Kirvan:首先,要明确厂商在迁移过程中的责任所在。系统崩溃时他们会采取什么行动?是否会进行支持并确保数据的完整性?这些东西都应该体现在需求方案说明书(request for proposal,RFP)中。CIO应该深思熟虑,准备时间在6个月到12个月之间为宜,由此确保人员、流程和技术都一一就位。你不能疏漏任何一方面,包括第三方厂商。

如果CIO不想依赖第三方厂商,或者不想在灾难恢复系统上进行大的投入,该如何应对呢?

Paul Kirvan:CIO可以考虑将各个分支机构作为关键系统和应用备份站点的可能性,即便只是一个销售分支办公室也不是没有可能。在此基础上建设一个灾备站点所需的投入远小于付给第三方云服务或者托管服务提供商的金额。一定要记住这一点,因为你可能每年为那些从未用到的服务付出大量的金钱。因此,为了有效地分散风险,考察下各个分支机构并将它们纳入到整体的灾难恢复规划中来。随着互联网和VPN的发展,这样做的技术难度也在逐渐降低。

很多CIO都热衷于数据中心的整合,你呢?

Paul Kirvan:相对于一个大的数据中心来说,我认为多个小型的数据中心有利于风险的分散。单一的大型数据中心就是个巨大的单一失效点。CIO一般都知道建设地理上分布的主备两个数据中心,但是如果你只有一个云服务提供商,那么它们的具体位置其实没什么太大意义。

比如我的一个客户,其主备数据中心相距80英里。看起来一切都已经没有问题,但是,要知道这个距离上的两个站点可能都处于同一个供电网络里。如果真的要进行数据中心的整合,那么一定要确认主站点是万无一失的。

在灾难恢复管理方面,那些东西是容易被疏漏的?

Paul Kirvan:大多数CIO在有个适当的应对举措之后就高枕无忧了,但是,一定要关注实际的执行效果。最近一次的流程测试是什么时候?最近一次对IT团队中的后备人员(作为主操作人员的备份)进行测试是什么时候?我可以明确地说,大多数企业并未经常进行这类测试。

而且,还要对所有脚本进行严格细致的测试,并且确保网络连接能在短时间内恢复。IT团队还要保证备份服务器能够在故障时顺利启动并接管系统。上述方面都是在灾难恢复方案中容易被忽略的。