专家博客 CDP将会改变数据恢复市场格局

本文作者Jeff Boles是市场研究与咨询公司Taneja集团高级分析师兼认证服务总监。 

过去五年来,我们在数据保护方式的改变上走过了很长的路。在忍耐了备份到磁带和从磁带恢复这样不可靠的方式后,我们进入了基于磁盘的备份的时代。如今,大部分大中型公司通过基于磁盘的备份方式改善了数据保护环境,至少是最任务关键型的环境。他们满足于磁盘上保存数周到数月的数据(用于数据恢复用途)和在磁带上保存更旧的备份以满足监管规制和商业合规的要求。随着基于磁盘案的技术变得更加可靠同时提供比磁带更加可测的结果,RTO(恢复时间目标)和RPO(恢复点目标)有了明显的改善。

但是大部分IT人员所采用的技术仍然是基于PIT(时间点)的。这毫不奇怪:在学会跑之前,你必须先学会走路。例如,虚拟磁带库(VTL)的设计就是在帮助你减少备份时间的同时改善备份可靠性和恢复效率。你可以在不改变备份流程的情况下做这些事情。你可以仍然维持原来每周完全备份和每天增量备份的模式,只是简单地提高备份/恢复速度和可靠性。此外,你可以继续采用以前的方式来进行DR(灾难恢复)。

但是,虽然这些技术有熟悉易用的优点,但是它们仍然无法最终解决PIT备份操作的问题,而这个问题可能会影响到生产应用程序并导致恢复过程中的数据丢失。好消息是已经有几家厂商在开发能够解决这些问题的产品。

PIT备份缺点

过去,数据保护的任务主要是定期创建生产数据的副本,并将其单独于生产服务器进行存储,以便能够在数据丢失、损坏或不可用的情况下恢复数据。24×7(一天24小时,一周7天)营运模式的兴起推动备份操作从离线变为在线操作,但是生产应用程序的性能受到影响,有些时候这种影响是很明显的,尤其是在备份操作过程中。

过去20年来,数据保护技术的进步–包括增量和差异备份、复用、更快的磁带技术、基于磁盘的备份、快照、VTL和重复数据删除–改善了数据保护流程,但是它们没有改变以PIT为导向的备份方式。PIT备份不可避免地导致恢复操作潜在的数据丢失,而数据丢失的数量取决于备份频率。

PIT方式的四大备份问题包括数据窗口、恢复点目标(RPO)、恢复时间目标(RTO)和恢复可靠性。数据保护技术的发展已经减轻了这些问题的影响,但是它们仍然存在。

CDP

连续数据保护(CDP)的概念很简单:在创建了数据集的基准线并存储在磁盘上之后,CDP捕捉应用程序进行的每次写入操作并保存所有与之相关的元数据(时间戳、卷关联等)。通过保存在磁盘目录中的数据,用户可以在任意时间点(APIT)随需创建卷镜像。你可以将CDP想象成数据的TiVo(硬盘数字录像设备)。

CDP技术改变了数据保护技术的格局。由于数据得到连续搜集,数据在创建以后就可以马上恢复–不需要等待备份完成后。它大大降低了即时资源消耗–不仅是生产服务器,还包括网络。CDP不是将所有数据改变打包后一次性地在网络上传输,CDP是在写入操作创建后实时地在网络上传输写入流。

虽然CDP的概念很简单,但是这个技术直到几年前才实现可行性。这主要是因为它有一个很难的问题要克服。一些厂商现在已经在提供CDP产品。CDP技术的潜力很大,一些创新型的厂商已经开发了综合的恢复解决方案,提供比基本CDP产品更为全面的功能。这些厂商将从根本上改变数据保护行业的格局。

精粒度数据捕捉技术的使用和APIT镜像的创建已经被证明是基于磁盘的恢复对相对近期数据的一个有力工具。IT管理员可以为应用程序选择、创建和呈现历史镜像("恢复镜像")。它改变了企业对数据保护的认识。

我们已经看到数据库和电子邮件数据保护行业正在快速地采用CDP。关键的突破是CDP可以自动选择应用程序数据的任何子集,精确选择需要的恢复时点,根据时间感知的元数据创建合适的镜像,将零数据丢失镜像提供给应用程序。实际上,已经有人在思考如何利用CDP解决方案建立一个可以适用于所有规模大小企业的先进的恢复管理功能。一些有效的使用情境已经出现,包括:

廉价DR:在许多情况下,CDP解决方案可以从本地客户端将数据捕捉到远程站点上的CDP目标端,也可以连续地在本地客户端和远程目标端之间进行数据的异步复制。对于灾难恢复,甚至对于两个站点环境不同的异质环境而言,CDP可以大大减少复杂性。与CDP相比,基于阵列的复制方式可能需要跨越多个阵列,同时还需要管理员仔细标记和管理单个已知的好的恢复时间点。此外,与没有保存历史数据点的复制解决方案相比,基于CDP的灾难恢复对数据损坏的容忍度更高。

完全DR下的本地备份和恢复:在这种使用情境下,来源端服务器设置成将数据变化捕捉到本地CDP目标端,而数据则同时复制到远程站点的另一个目标端(这个复制可以是主机进行的,也可以是CDP目标端进行的)。这种方式为数据复原或测试提供了站内目录以及作为站点层次恢复或离站测试工具的远程站点,使两个地点都拥有全部的数据集。与远程目录相比,利用CDP进行本地化的备份和DR可以更简单。远程目录可能需要复制全部的PIT备份数据集,这不仅非常消耗带宽,而且还涉及数据保护软件复杂的恢复操作。

合规要求下整合的备份和DR:使用和上述解决方案同样的架构,CDP解决方案可以有效减少前端磁带存储。所有短期恢复操作都直接利用CDP解决方案从磁盘中进行,同时数据定期直接从CDP目录卸载到磁带–不管是重建客户端数据还是作为CDP目录的块层次镜像都可以。在这种方式下,对配置CDP的主机而言,所有磁带互动可以避免,而除了与CDP系统相连的磁带架构以外,磁带支持架构的规模可以大大缩减。这些磁带可以本地存储,也可以远程存储以满足合规要求。

Taneja集团的观点

与我们预计的时间相比,IT人员了解CDP能力的过程显然花了更长的时间。当然,过去几年来,所有主要的厂商都开始进入CDP市场,从而推动CDP成为主流技术。如今,市场上已经有很多CDP厂商,比如Atempo、BakBone、DataCore、EMC、FalconStor、IBM、InMage和赛门铁克。一些厂商是刚刚涉足CDP而且最近才增加复制功能。一些厂商则首先专注于DR方面并且现在已经将解决方案扩展到本地备份和恢复。我们看到,无论知道还是不知道连续数据技术(CDT)(也无论他们是把它叫做CDT还是其他名字),所有这些厂商都在朝着更加复杂的连续数据技术方向前进。

CDT的功能很强大。一旦你创建了模式并拥有可以在任意历史时间点创建镜像的能力,与副本创建有关的一切将极大改变。CDT不需要备份窗口,可以提供快速、可靠和零数据丢失的本地恢复;它可以进行大规模DR,辅助虚拟化服务器,使原来被排除在数据保护大门外的新的应用程序得到数据保护。对于IT管理而言,更重要的是,CDT简化了环境,它可以替代多个产品和流程,通过单一的解决方案来实现多重目的。