本文作者DANIEL J. BUDIANSKY是数据管理论坛重复数据删除与空间节约特别兴趣小组的联合主席,也是Data Domain的一位企业应用程序技术专家。
现在,如何高性价比地拥有灾难恢复(DR)能力是大多数组织所面临的挑战。IT经理和管理员必须处理好如何存储数据的多个副本以防备所有可能的灾难故障情境这个问题。这些副本必须保存在独立于主副本的存储系统中,并且在地点上也要足够分散,以确保灾难发生不会影响到数据的所有副本。
虽然本地快照可提供有效的时点恢复机制,但是它们的空间效率比较有限,而且如果共享数据受到破坏或发生故障,那么本地快照也会受到影响。远程存储系统之间的复制,无论是同步的还是异步的,都可以满足地点分散上的要求,但是复杂性和成本经常使得这种机制只能用于一部分关键数据(如果丢失这部分数据会导致业务连续性解决方案无法工作的话)。
如果原始格式数据集复制所需要的WAN(广域网)带宽太高,IT组织经常选择利用现有的磁带备份流程来代替远程复制,并将磁带离站存放,以提供灾难恢复功能。针对这种情况下,重复数据删除可用于解决这些灾难恢复问题。
网络存储行业协会(SNIA)将重复数据删除定义为"替代数据的多个副本–在不同层次的粒度性上–的共享副本方案,可以节约成本空间与/或带宽。"
不同规模的企业都可以从重复数据删除的空间节约效应中获益,因为重复数据删除可以极大地减少物理存储要求,从而相应地节约电能、空间、冷却和管理成本。为了理解这种数据缩减方式的全部效应,用户同时应该检验重复数据删除是否可以明显减少远程复制下的带宽要求。通过带重复数据删除功能的远程复制,备份数据可以在站点之间更加有效地复制。通过访问替换站点磁盘上的数据,组织可以提高在高成本效率灾难恢复流程上的开发、测试能力。
理解重复数据删除比率
一般来说,包括重复数据删除在内,所有数据缩减技术的效果,一般都用比率来表示:逻辑数据的原始大小除以最终存储数据的结果大小。例如,一个系统正在存储10TB大小的逻辑备份数据(根据每周完全备份/每日新增备份策略,对1TB数据集进行八周保留),如果在进行了重复数据删除后,系统最终只需要1TB的物理存储,那么这个数据缩减比率就是10x(或10:1)。
为了能够理解10x重复数据删除比率的真实意义,一定要将临时背景也要考虑进去。在一般的数据备份中,数据被定期写入系统,然后在保留期满以后再行删去。对于一定平均变化率的给定数据集来说,保留期越长,那么总的重复数据删除比率也将呈线性地增长,如图1所示:
当数据达到保留期以后,最旧备份因到期将从系统中删除,因此即使新备份加入系统,逻辑数据的总量也将大体保持不变。因此,此时该系统的总的重复数据删除比率将大体保持不变。
如果只有新的重复数据删除数据才被复制,那么总的空间节约效应是不一定等于带宽节约效应。更有效的指标应该是新数据写入时的重复数据删除比率。
这里再用同一个例子,虽然八周时间里总的数据缩减比率是10x–在这种案例中,意味着只要传输100GB的数据就可以远程复制1TB的备份–每周完全备份的数据缩减比率却可能达到40x或更高。因此,不需要1TB,只要25GB的WAN数据传输就可以复制每个逻辑完全备份。另外,只要用户采用重复数据删除,就能够得到这种好处,而不用等待时间积累。
通过带重复数据删除功能的远程复制,许多企业发现它们现有的WAN带宽足以满足它们的要求。一些厂商还提供了衡量这些效应的工具,让IT组织可以了解重复数据删除所带来的空间节约和带宽节省效应。
简化低成本灾难恢复
对于已经构建了备份数据的灾难恢复计划的组织来说,使用带重复数据删除功能的远程复制至需要稍微改动一下目前恢复数据的流程即可。对于这些组织来说,这样做的主要好处就是可用性得到了改善,因为只要数据已经完成复制,那么就可以随时访问灾难恢复站点磁盘上的数据,能够尽快地恢复数据。这样可以极大地改善营运效率,至少可以减少磁带搬运和处理的时间和成本。由于不需要再从存放地点取回磁带并将磁带载入磁带库,因此灾难恢复测试和审计的频率也可以提高。此外,远程复制后的数据副本可以用于磁带合并和操作恢复用途,例如,刷新开发/报告环境。
在灾难恢复中,将重复数据删除和远程复制结合在一起可以最大化营运效率和成本节约。空间节约效应使得组织可以在更长的时间里存储更多的数据,节约更多的物理磁盘。这种方式节约了磁盘备份的总体成本和占用资源。带宽节约效应可以推动高效率的远程复制,同时避免了离站存放方式中的对手工操作以及劳力密集型流程的依赖。如果用户能够正确评估重复数据删除对存储和带宽所带来的正面影响,那么重复数据删除就更可以发挥在营运效率和成本节约上的所有潜力。
读者可以阅读SNIA数据管理论坛重复数据删除与空间节约特别兴趣小组(DDSR-SIG)的报告。DDSR-SIG是致力于推动各个网络存储技术实现空间节约的工作组。该工作组针对重复数据删除的优点和使用发布了各种教育白皮书,网络播放视频和技术指南。相关资源可以在这个网址中找到:www.snia.org/forums/dmf/programs/data_protect_init/ddsrsig。