爱数:部署备份容灾方案瞻前亦需顾后

在前一篇中我们对备份容灾方案需要涉及到的潜在风险分析、业务影响评估、目标设计以及方案选型等做了详细分析,旨在做到未雨绸缪,见微知著,备份容灾方案要想效果好,事前事后均要考虑周到,瞻前还需顾后,下面我们再来分析一下顾后的工作具体涉及到哪些层面。

(一)备份容灾要给力 实施验证需专业

堡垒的防御战需要有厚实的城墙做保护,对于备份容灾方案来说,后期的实施验证就相当于坚不可摧的城墙,然而更加特殊的是,它不仅仅是质量要给力,技术验证更需要到位。

1、方案实施

为现有应用系统实施备份容灾保护方案是一件非常专业的工作,需要在对现有环境进行全面评估的基础上,制定详细的实施计划,从而发现实施过程中可能存在的风险及应对措施,再根据计划来进行实施。

由于应用系统环境的差异,要达到设定的保护目标不同应用系统往往需要采用不同的保护技术,因此首先需要对现有IT环境进行全面的评估。评估时一般需要收集应用服务器性能、需要保护的数据量及应用系统所处的网络环境等信息,有了这些信息后就可以有针对性的选用保护技术;如某数据库服务器数据量非常大,且服务器的中的数据非常重要,应此备份频率必须较高,如果采用普通的备份方式势必无法满足,所以就需要采用LAN-Free的备份技术来加快备份速度,减小备份窗口及备份时对工作网络的影响。

通过环境评估,确定了应用系统需采用的保护技术及对系统带来的影响,我们再根据这些信息制定详细实施计划。实施计划一般包括实施的时间、流程、保护策略等信息,用于指导实施过程。由于实施过程可能对现有的应用带来一定的影响,如果不事先规划好,就可能出现实施时影响到正常生产的现象。如容灾方案都会有一个初始化的过程,而这个过程往往会占用相对较多的系统资源,如果没有事先考虑到,就有可能在系统最繁忙的时候来执行初始化操作,这就会出现灾备系统和生产系统抢资源的问题;而有了事先的计划后,便可在实施时错开这个时间点,将实施对生产的影响降到最低。

形成的实施计划,需用户和厂商技术人员确认后再开始实施。由于用户系统的复杂性及灾备方案的专业性,实施过程一般需要IT管理人员和厂商技术人员来共同参与,实施过程中IT管理人员负责准备实施环境,而厂商技术人员则安装调试灾备系统,并记录下实施的过程,已方便后期的维护。

2、方案验证

实施部署完成后,需通过有效的方式来进行验证,以确保方案可以达到预期的目标。验证主要从两方面进行:RPO/RTO目标验证及灾难恢复验证;RPO/RTO目标验证可用于检验方案对生产数据的保护能力,包括数据备份/恢复的粒度、速度、数据完整性等内容,一般采用在非工作期间备份数据并恢复到异机的方式来验证;灾难恢复验证则更偏重于检验灾难发生时恢复应用系统的能力,包括快速接管应用系统、恢复生产服务器等方式。

(二)方案效果要保证 维护管理需用心

实施完备份容灾方案后,并不意味着就可以高枕无忧,虽然备份容灾方案可以有效的保证数据的安全及业务的连续性,但如果没有有效的管理和维护,再好的方案也无法发挥作用。

要维护好灾备系统,首先就需要根据企业的实际情况制定合适的灾备系统管理和维护规范,明确责任人,制定定期检查计划,定期灾难恢复演习的计划以及灾难恢复规范。通知到相关人员,让灾备系统的维护管理工作常态化,让相关人员都知道当灾难发生时应当如何操作。

之后再根据制定的灾备系统管理规范和计划,为灾备系统提供有效的维护。主要内容也可以分日常检查、维护工作及定期的恢复演习操作。日常检查一般指查看灾备系统运行状态,以便及时发现运行过程中存在的问题,并作响应的调整,保证灾备系统的正常运行。爱数备份容灾家族提供了完善的告警机制,当任务或系统出现有异常时,可通过多种方式通知到相关人员;另外还提供了详细的日志及直观的报表统计,将系统的运行状态一目了然的展现在管理人员眼前,可帮助用户准确的了解系统运行情况。恢复演习操作则用户定期检测灾备系统的可靠性,包括定期恢复备份数据以确认备份数据的可用性及完整性;而对与容灾的应用来说更多是采用灾难恢复演习的模式来进行,通过模拟一些灾难发生的情况,启用备用系统接管应用,来检验容灾方案的有效性,同时还可以让相关人员在了解灾难恢复规范的基础上进一步熟悉操作的过程。

更多关于ROI的内容,请点击:http://www.eisoo.com/marketing/roi/