双机应用容灾事 飞入寻常企业“家”

“旧时王谢堂前燕, 飞入寻常百姓家。”是唐代诗人刘禹锡《乌衣巷》中的句子,充分地表达了对时光力量的感叹,就如同我们今天要谈到的双机集群容灾方案一样,它已经不再是企业信息化建设中的奢侈品,而是渐渐地走下神坛,开始融入到寻常企业之中。爱数无疑是这个进程中强有力的推动力。

一、摁下葫芦起来瓢 容灾问题呈多元

目前的中国,正处在工业化、信息化的大潮中。经过多年的发展,各大企事业单位的业务体系对IT系统产生了巨大的依赖,使得目前业务连续性需求和系统的稳定性之间的矛盾成了IT建设中的首要矛盾。在这种矛盾的催化下,大量的容灾和容错技术纷纷面世,比如双机和集群技术,它提供了一种较为快速和经济的方式解决这种矛盾。双机集群方案的出现更大幅提升了业务系统的容错性,但随着时间的推移,传统的双机集群方案开始面临诸如业务量的提高、业务连续性的需求增强、异地容灾能力缺乏、设备老化等方方面面的瓶颈,用户不仅需要面对现有数据和业务系统得不到全面保护的问题,还需要面对如何针对现有的双机/集群环境进行容灾保护的难题,摁下葫芦起来瓢,头疼问题接踵而来。

这时候你可能会想是不是还是传统的灾备方案好,那我们就来回顾一下传统灾备方案到底利好如何:

对容灾而言,应用系统的稳定性和数据的有效性是两个重要因素。而在 IT 基础设计建设的早期,人们在应用系统的稳定性上投入了更多的关注,因此传统的主流双机集群方案采用共享存储作为数据载体。这样一来,如果存储服务器发生故障,则整个业务系统就会发生瘫痪。同时对于软件本身的Bug、管理员误操作、或者来自网络的病毒以及木马的袭击等对存储造成的逻辑错误,传统的方案也缺乏有效的历史数据恢复防范措施。

尽管大多数的双机集群方案都使用了Raid 技术,具有一定的容错保护,但依然无法完全克服共享存储所带来的存储的单点故障和历史数据可追溯性需求。因此,对传统的双机集群进行容灾保护,成了新的专注点。但由于双机集群系统的特殊架构,应用容灾方案往往变得异常复杂且价格不菲。这对于中小型用户而言望尘莫及,使得容灾方案的普及变得难上加难。

二、灾备一体称王道 双机集群吞入肚

这样看来,如想让“双机应用容灾事,飞入寻常企业家”,就必须提出保证业务和数据安全的前提下,成本更加经济的容灾方案。最理想的方式是在原有的双机方案基础上进行升级,尽量不去改变用户现有的网络和存储架构,最大限度地保证初期 IT 建设的成本不被浪费。这也正是爱数进行双机应用容灾方案设计时最基本的出发点。

最有利于操作和部署的双机应用容灾方案,应该是不需要生产服务器双机和容灾服务器型号完整一致,不用担心后端存储系统的兼容性问题,无需改变原有的网络架构,只需在网络中部署爱数备份存储柜或爱数备份软件,并在双机集群中的每个服务器上安装客户端软件,划分相应的存储空间,部署相对简单,而且能够在同一Web 界面上进行统一管理,大大降低了操作难度和管理成本。同时,新的故障检测技术、CDP 技术的引入,该方案可以满足较高的 RTO/RPO 的指标要求,下面让我们来简单分析一下这个方案是如何工作的:

(一)双机整体容灾

在生产服务器端,双机集群系统将被视为一个有机的整体,任意一台服务器在对外提供服务的时候,该机器上挂载的共享资源都会被客户端程序实时监控,变化的数据会源源不断地被输送到爱数备份存储柜或爱数备份软件这个中间层中。同时基于源端的重复数据删除技术不断地精简实时复制数据,减少网络传输量和存储数据量。在爱数备份存储柜或爱数备份软件端,任何生产服务器上的发生变化的数据都将生成一个时间点,保证了任一时刻数据的可追溯性,实现了对存储数据的 CDP 保护,能够有效避免应用逻辑错误,同时爱数独有的时间点生成策略为用户提供了个性化的数据存放方案,不但满足了不用用户对数据保存周期的需求,而且降低了空间使用率。

(二)不中断的复制

当双机中对外提供服务的机器发生应用故障时,会即刻触发切换操作,客户端软件上搭载的智能化故障检测模块也会第一时间将监控对象切换为当前工作主机上的资源,保证其开始对外提供服务时,已经开展了有效监控,保证实时复制数据的有效性。简而言之,任何一次切换发生时,CDP 的保护对象也将随之切换。唯一不变的是,爱数备份存储柜或爱数备份软件的容灾存储上的数据保持和生产存储一致。

(三)更有保障的双机应用

如果双机系统的磁盘阵列(共享存储)发生故障,双机系统彻底瘫痪,容灾服务器可立刻接管双机应用系统,并对外提供服务。如果存储系统从故障中恢复,可将容灾服务器上的最新数据反向复制回原磁盘阵列。并在双机修复完成之后,通过手工接管方式将存储切换回来。如果存储阵列发生逻辑错误,管理员可将应用恢复到发生错误之前的任意一个时间点,有效避免了传统方案中数据没有可追溯性和使用定时备份方案可追溯性差的问题。

(四)更低成本的虚拟化容灾

如果用户选择基于爱数备份存储柜的方案,容灾服务器可部署在一体化备份存储柜内置的虚拟化平台中,这样就无需增加额外的物理设备。除了 CDP 数据以外,容灾存储上永远会保留一份最新的生产数据,使得共享存储端在发生故障时,该份数据可直接被使用系统使用。

至此,我们看到了一个基于原有双机架构的应用容灾方案,它没有浪费任何的初始投资,将企业现有的双机系统充分保护起来,既近似双机双柜的业务连续性,提供更高的业务连续性,同时也具有历史数据,任何逻辑操作都可以实时回滚。在拥有 RTO/RPO 指标最小化的同时,实现总体拥有成本的降低。这是爱数又一次 ROI 理念的实践,为双机应用容灾方案的广泛应用提供了强大的驱动力,在实现爱数普及容灾方案理想的漫长道路上迈出的坚实一步。