保护数据安全和提高数据的持续可用性,是存储系统不断追求的最高目标。在今天这个复杂的信息环境中,要保障数据的安全,只有数据备份是远远不够的,容灾作为数据安全性和业务连续性的最高保护级别,对于高数据安全性的企业来说也是不可缺少的。容灾是一个范畴比较广泛的概念,广义上,我们可以把所有与业务连续性相关的内容都纳入容灾。容灾是一个系统工程,它包括支持用户业务的方方面面。而容灾对于IT而言,就是提供一个能防止用户业务系统遭受各种灾难影响破坏的计算机系统。容灾还表现为一种未雨绸缪的主动性,而不是在灾难发生后的“亡羊补牢”。
中科同向作为优秀的数据容灾备份软件供应商,对于容灾有着独到的认识。
要正确认识容灾,还必须从概念上将容灾与数据备份区别开来。
远程容灾是指为了防止因火灾、地震、人为破坏或设备故障造成系统瘫痪、数据丢失、业务中断,而在数据中心之外的另一地点建立备份中心,备份中心具有与主中心相同或相似的主机、网络和存储设备。系统正常运行时,应用会将数据同时写向主数据中心和备份中心的存储设备,并保证二者的实时一致性。当主数据中心发生灾难时,应用能够快速地自动切换到备份系统,从而保证数据完整性和业务连续性。当主中心系统恢复后,主中心的存储设备会向备份中心存储设备进行数据重新同步,然后应用切换回主中心。
容灾可以分为三级。第一级为“冷容灾”,即所谓“电子磁带入库”方式,可以有本地入库和远程入库两种子项,实际上就是备份,只不过可以将备份放置在远离数据中心的第二或第三个地方;第二级为“温容灾”,即所谓“磁盘镜像/复制”方式,也有本地和远程两个子项,和备份不一样用户能够在远程在线使用镜像后的数据;第三级为“热容灾”,即所谓“远程群集+磁盘镜像/复制”方式,这种方式可以允许整个过程自动地在本地和远程进行。
真正的容灾系统必须满足三个要素:首先是系统中的部件、数据都具有冗余性,即一个系统发生故障,另一个系统能够保持数据传送的顺畅;其次,具有长距离性,因为灾害总是在一定范围内发生,因而充分的长距离才能够保证数据不会被一个灾害全部破坏;第三,容灾系统要追求快速的数据恢复,也称为容灾的“3R”(Redundance、Remote、Replication)。
谈到容灾与备份的区别,两者的区别在于:
(1)容灾主要针对火灾、地震等重大自然灾害,因此备份中心与主中心间必须保证一定的安全距离;数据备份在同一数据中心进行。
(2)容灾系统不仅保护数据,更重要的目的在于保证业务的连续性;而数据备份系统只保护数据的安全性。
(3)容灾保证数据的完整性;备份则只能恢复出备份时间点以前的数据。
(4)容灾是在线过程;备份是离线过程。
(5)容灾系统中,两地的数据是实时一致的;备份的数据则具有一定的时效性。
(6)故障情况下,容灾系统的切换时间是几分钟;而备份系统的恢复时间可能是几小时到几十小时。
容灾作为一种新的概念,目前已经被国内大多数行业所接受,特别是在金融、电信等信息密集型企业,实施容灾级别的数据保护工作已经被提上了日程。但是,容灾的实现仍然面临着多方面的难题。其中,除了投入过高这一普遍因素外,对容灾如何确切理解、在具体实施过程中存在的技术问题等,都成为企业建立容灾系统的障碍。实现容灾功能包括三个环节:远程数据复制、远程动态监测和应用切换。远程数据复制的实现方法有三种:利用数据库厂家的软件产品完成远程复制,利用主机进行远程数据镜像,和利用存储设备厂家的软件产品完成远程复制。为实现故障情况下的切换功能,数据复制的同时,还需要类似主机集群的软件,对应用进行动态监测。主、备中心的应用主机均要安装这种远程动态监测软件,主机间除了网络连接,还需要专线做心跳监测。远程动态监测软件通过心跳线实时监测其它主机和应用的状态,当主机/应用发生故障时,远程动态监测软件会马上监测到,将故障情况向管理员报警,然后根据策略自动或手工快速地将应用切换到远程的主机。