专家博客 重复数据删除的复制模式

本文作者George Crump是Storage Switzerland的创始人,同时也是George Crump Consulting的创始人。

根据我和重复数据删除解决方案提供商的交流,复制和重复数据删除产品由很强的关联性。在大多数情况下,超过50%的重复数据删除产品是和复制模块一起销售的,或者附加了复制功能。在下面两篇文章中,我将评论一些特定厂商的声明,并指出那些和复制有关联的厂商的名字。如果您是重复数据删除业内人士且没有和我交流过,那么可以和我联系。

虽然将备份工作迁移到远程站点是重复数据删除产品的重要功能,但是这不应该变成你进行灾难恢复的唯一手段。重要的是,要记住远程站点的数据是备份格式的,需要恢复到灾难恢复服务器才有价值。将数据从磁盘重复数据删除设备迁移到生产服务器仍然需要花一定的时间。这个时间有可能会让你无法满足恢复服务水平协议的要求。对于许多数据中心来说,以廉价的方式离站存储数据,他们可能可以承受的就是本地备份完成后的几个小时,不过从数据恢复性上来说,这可能还是一个很大的进步。

恢复问题有一个例外:服务器虚拟化。由于一些基于设备的系统表现为CIFS(通用互联网文件系统)或NFS(网络文件系统)上的磁盘目标端,你不能通过NFS在灾难恢复站点上载入服务器镜像然后回到生产。没有任何一款基于设备的系统是主存储,因此可以通过像VMware Storage VMotion这样的功能将这些镜像快速地迁移到生产存储。这个概念值得用一整篇文章来讨论。我将在以后对它进行讨论。

在我所交流过的重复数据删除厂商中,虽然一些厂商是刚刚开始在解决方案中提供复制功能,但是现在差不多所有的厂商都有提供复制功能。一些重复数据删除提供商通过基本的文件系统复制技术来提供复制功能。基本上,他们利用了重复数据删除系统只写入唯一数据块这一点,并且他们使用文件系统复制来确认这些写入,然后在网络上复制数据。虽然从"A点到B点"的角度来说这肯定可以,但是当你试图进行多到一复制或瀑布型复制的时候,这可能会带来一些问题。

厂商进行重复数据删除的方式,即在线与后处理之争,会影响复制模式的工作方式。大多数厂商同意在线与后处理方式的重复数据删除各有优点和缺点。重点是它们如何利用优点并规避缺点。例如,在进行复制的时候,在线系统甚至自适应在线系统应该要可以在数据写入设备或特定备份流到终端的时候复制数据。在典型的后处理重复数据删除系统中,整个备份必须在重复数据删除开始之前完成。随着唯一的数据块得到确认并写入磁盘,复制功能开始运作。

数据进入系统或软件的方式会影响复制工作开始的方式和时机。让灾难恢复副本可以进行恢复所需要的时间是最重要的。就像我前面所说的,把数据放在灾难恢复站点或灾难恢复托管提供商那里更好。虽然重复数据删除看起来已经很普及了,但是我所看到的大多数研究显示重复数据删除渗透率仍然在25%以下。这意味着只有12%以下的潜在数据中心在使用带复制功能的重复数据删除解决方案。