存储分析:备份前端技术的发展趋势

过去的几年里,有关于备份技术的话题始终聚焦在目标介质领域——磁带和磁盘之间的PK。这场竞争的结果似乎已见分晓,大多数用户和IT供应商更倾向于使用磁盘介质。因此,用户现在的关注点已经转移到了备份过程的前端环节,即数据的捕捉和传输。

据ESG调查统计,2004年之前约60%的受访企业直接将数据备份到磁带上,而没有使用过任何磁盘备份技术。但是到了2010年,这一比例下降到只有20%。在此期间,约有80%的受访机构告诉ESG他们在备份过程中使用了磁盘技术,该技术帮助他们缩小了备份窗口,也满足了更高的RTO(恢复时间点)指标要求。然而,数据量目前仍然在以指数级的速度不断增长,这也意味着对备份系统的要求会越来越高,备份的流程也需要更新。其结果促进了CDP技术、复制技术、源端重复数据删除技术以及快照技术的广泛应用。ESG研究发现,这些技术的使用情况有不同程度的明显增长:在从2008到2010年,快照的应用增加了2%,复制增长了34%,CDP增长了58%,而同样在这两年之内,重复数据删除的应用则大幅提高了66%。

快照和镜像备份

在什么样的情况下,我们能压缩备份窗口,加速系统恢复,并且达成高效的容灾呢?高效率,那是基于快照和镜像备份的最大特点。快照是卷或者文件系统在指定时间点创建的拷贝,利用快照的功能优势做数据备份,能够极其明显的降低备份过程对应用系统的影响。快照备份可以压缩备份窗口,提供秒级或分钟级的RTO指标,通过每天更多频次的快照,还可以获得更好的RPO指标。

镜像备份也可以利用快照技术,为系统数据创建一个指定时间点的完整拷贝。系统数据可以是硬件配置信息、操作系统、应用程序或业务数据等等。镜像是一个独立的可移动的文件。基于时间点的快照备份属于热备份,所以关键的应用系统在备份过程中不需要中断。快照备份极大地削减了备份窗口,并且能够快速进行系统的整体恢复,恢复的目标可以是虚拟机或物理机,也可以恢复到异构的硬件平台。快照和镜像备份在数据的捕捉、传输和存储环节的效率都非常高,最初需要做一次完整的数据初始化拷贝,之后进行的数据捕捉和存储则都是针对增量数据块。

CDP

CDP技术的原理是连续捕获变化中的数据。它可以基于文件、也可以在数据块层或者在应用层,支持细粒度水平的数据捕获和精度恢复选项。CDP引擎会给每个写操作都打上时间戳标记,然后将这些经过处理的写操作镜像保存到一个记录日志中,从而连续跟踪数据的变化。当需要做数据回滚时,CDP引擎会根据我们指定的时间点,为产生卷创建一个在该时间点的映像卷,而这个过程不会影响到生产应用程序的运行。

块级CDP在逻辑卷层进行操作,记录每一个写操作。这种类型的CDP技术的突出特点在于透明捕捉数据,而且能够形成任意时间点的数据视图。通常,CDP引擎与被保护的应用程序在同一台服务器上运行。文件级CDP在文件系统层面进行操作,可以记录文件系统上发生的任何改变。应用感知型CDP则能够在CDP数据流中跟踪关键应用程序的检查点信息,有了这些信息之后,数据的回滚恢复会变得异常简单。比如跟踪数据库的交易一致性检查点,或是Email等应用程序的一致性检查点。

CDP连续数据保护技术完全摒弃了离散的备份形式,代之以透明的、连续数据采集过程,生产服务器只需要很低的备份开销。此外,应用数据一旦产生就立即被CDP捕获,因此基于CDP的备份解决方案可以恢复最新产生的数据,RPO指标接近为零。

复制

复制技术是所有这些备份策略的基石,目前也越来越多地被用于数据保护。复制是一个独立的进程,可以保护应用程序,提供可操作的灾难恢复能力,且具有最佳的RPO和RTO指标。作为一种为文件级集中备份而整合分散数据的技术,复制可以同快照或者CDP结合使用,维护一份远程的数据备份,从而实现容灾应用。通过复制技术,我们可以在本地或远程维护一份精确的数据镜像,发生灾难时,复制卷能够快速挂载到主机恢复生产数据。在数据初始化拷贝结束之后,通过块级增量复制以及网络压缩过程,存储的容量和带宽都可以得到优化。

在主机层、存储层和网络层都可以实现数据复制。通常,磁盘阵列和网络层产品使用的都是基于块的复制技术,而主机层复制主要在文件系统层。主机层大多提供异步复制,而磁盘阵列和网络层则通过配置,可选异步或同步复制。同步复制的原理是,只要生产系统发生数据写操作,这些操作都会实时复制到目标系统。异步复制则是一种准实时的操作,只有当数据在生产系统上写完之后,才会复制到目标系统。

源端重复数据删除

去重技术能够识别并消除数据的冗余部分,只保存唯一的数据单元,而重复的部分则用指针代替。数据去重功能对于优化备份流程来说是非常值得推崇的,只是目前大多数数据去重方案都是在备份目标端实现。这里讨论的源端去重技术只备份发生过修改的数据段,这也意味着在采集、传输和存储环节只需要处理相当少的数据。由此,备份的时间被大大缩短。而备份窗口最小化带来的好处是备份频率的提升,我们可以获得更细粒度的恢复时间点,进而满足苛刻的RPO和RTO指标要求。

 ESG的研究结果显示,目前许多机构正在大量替换原有的文件级备份产品。例如,ESG调研过的IT机构中,计划用快照或CDP解决方案替换原有文件级备份的占到55%。也就是说,将快照、复制、CDP和去重技术整合进已有的备份平台,作为文件级备份的增强已经成为一种明显的趋势。而目前一些备份厂商高调推广数据实时采集技术和目标精细恢复策略,对备份前端流程进行简化和优化,也间接证明了这个趋势。