企业运作越依赖于IT架构,对信息系统运作的稳定性和可靠性的要求就越高。业务连续性将是最重要的竞争力。
老吴所面临的问题,也是不少IT主管面临的问题,几乎每一个IT主管或总工在规划企业整体IT架构时都会面临是否以及如何建设灾备中心。对于现代化和信息化的企业来说,灾难备份或业务连续性的考虑,是不可回避的。
信息数据是宝贵资产
跟老吴的公司类似,很多企业在信息化基础上,业务发展和提高竞争力要求信息的互通、共享,要求IT架构能动态、快速地响应客户需求、业务流程的改变等。所以很多IT主管跟老吴一样,正在重点规划数据集中、IT系统架构整合。
企业运作越依赖于IT架构,就对信息系统运作的稳定性和可靠性的要求越高。所以IT系统的完善程度,提供全天候业务运作,是竞争力的一个最重要的前提,即业务连续性的重要性。
- 信息和数据是企业最宝贵的资产,事关企业的经济运行命脉和商业信誉;
- 分散的系统和数据正在重新集中,数据和信息系统整合集中在单一或少数系统平台架构上已经是一种趋势,而集中到单一系统的风险压力也随之增加;
- 更多企业已经认识到灾难恢复计划的重要性,一旦发生灾难(洪水、地震、火灾等),或者人为灾难(用户失误、磁盘失效等)时,可以尽快地恢复用户重要的数据,恢复业务生产。
毁灭性灾难只是一小部分
不仅仅是为了针对毁灭性灾难,灾难备份是减少或防止各种停机及造成的损失。美国明尼苏达大学研究机构的统计结果表明,对于银行,金融,证券,电信等行业的企业而言,如果业务停顿时间长达两天或更长,那么25%的企业将立刻因信誉和业务问题而倒闭,40%的企业将因为受到持续不断的后续因素的影响导致综合竞争力的下降而在以后的两至五年内被淘汰,五年以后仅有7%的企业能够继续在此行业内生存。
而造成停机的原因,老吴提到的火灾、洪水、战争等毁灭性灾难,只是其中的一小部分。灾难备份考虑的要减少和防止的停机情况包括:
- 灾难。如战争、恐怖袭击;地震、洪水、火灾或飓风;长时间停电;服务器瘫痪、大的硬件故障等。
- 计划内停机。如机房维护、硬件迁移/更换、数据维护。
- 人员造成的错误。如不小心删除了一个表格、批处理逻辑错误、人为破坏等
当然,能够防御所有灾难的方案是不存在的,也是不现实的。考虑灾难备份系统建设时,也应该实事求是。用户根据不同地区,不同行业的要求定义灾难。
灾备方案平衡风险和成本
对于大多数企业而言,提到灾难备份,最直接的反映就是增加预算。灾备中心建设,购买更多的主机、存储设备、相应软件等。虽然这是实施灾难备份项目的一个必要步骤,但是,实施灾难备份项目的第一步应该从“分析评估以确定灾难备份需求目标”开始,是业务的需求决定进一步的灾备方案。
灾备的需求目标主要包括:RTO (Recovery Time Objective) 恢复时间目标。时间越短越好,但这同时也意味着更多成本的投入,即可能需要购买更快的存储设备或高可用性软件。
通过业务冲击分析(BIA-Business Impact Analysis),估计业务停顿随时间而造成的损失,进而确定对该企业而言比较适合的RTO目标。通常企业规模大,要求的RTO恢复时间越短。
RPO (Recovery Point Objective)恢复点目标,或者是能够容忍的数据丢失量。RPO目标的确定不是依赖于企业业务规模,而是决定于企业业务的性质和业务操作依赖于数据的程度。RPO目标是通过与各业务部门主管的交流,了解业务流程和IT应用的关系,确定能够支持该企业核心业务的RPO目标。
根据不同的恢复目标和实现方案,灾难备份技术方案分为七个级别。
这七个级别的灾备方案中,随着灾备目标不同,方案及成本也有不同。恢复时间要求越短,成本越高。合适的灾备方案应是基于“风险和成本相应平衡”的。老吴应该基于风险分析的基础上,选择业务需求目标和成本相平衡的灾备方案。
另外,老吴面对的企业并购、数据集中需要的IT规划,是基于业务需求的IT规划必经之路,应该着手进行全面风险分析评估和业务连续性规划设计,把灾难备份纳入IT整体规划中。
当然,企业的业务持续计划及灾备规划的设计不是一蹴而就的简单步骤,应该是一个持续并循环往复的过程,每一阶段都能持续不断的改进,并且在实际工作中体现有效性与高效性。