重复数据删除目前正在成为数据备份和恢复方面最为重要的一项技术,以相对合理的价格提供了简易地成本节省方式。长期以来,重复数据删除设备被谈及很多,而最近重复数据软件更让人影响深刻,其提供十分有用的性能,价格较相应的设备也更为经济。
而目前几乎所有的备份软件都已经将重复数据删除功能作为一种特性集成在产品内部(HP的Data Protector是极少数例外),这或许是一个关键因素,使得重复数据删除技术十分易于部署。
重复数据删除软件较相应应用而言的优势
Lauren Whitehouse是ESG的分析师,他列举了许多重复数据删除软件所带来的优势:
重复数据删除软件提供单一的管理界面,重复数据删除策略可以集成在整个备份策略内部,而无需在另外一个单独的界面中额外设置。
备份软件中的重复数据删除技术允许所进行的重复数据删除更接近原数据(在生产系统或备份服务器上)。重复数据删除流程因此可以分布在整个环境中,而非集中在一点(像重复数据删除设备那样)。
在重复数据软件中更容易实现全局重复数据删除
Lauren Whitehouse说,备份软件具备内容识别性,其了解哪些是实际数据。而相应设备仅作用于备份数据流的接收终端,做不到备份软件这样——除非是设备厂商颠倒设计格式。并且Lauren Whitehouse 还补充道,“内容识别性使得重复数据删除软件可以了解到实体模型在数据流中的位置,因此可以实现更高的重复数据删除率”。
备份软件会记录进行重复数据删除后的数据上的所有操作。这意味着恢复操作是流线型的。而通过复制技术进行的备份操作是设备所无法跟踪记录的……除非用户使用Symantec的NetBackup或者Symantec Backup Exec配合OpenStorage技术(而且该设备需要支持OST)。
而重复数据删除的可扩展性通常也会更容易一些(除非设备使用的是无缝扩展技术,像Exagrid System,NEC和Sepaton公司的一些产品,其提供网格体系架构的方式)。
此外,许可证也是不同的,软件的重复数据删除显得更为经济,有些甚至是免费的。
可选择的磁盘供应商也更为灵活,软件可以使用现有磁盘而且用户可以选择任何供应商的存储系统。
重复数据删除应用的优势
Whitehouse说,从另一方面,重复数据删除应用也有其独特的优势。举例来说,在一个设备中数据的重复数据删除操作有独立的系统完成,其针对重复数据删除流程进行特别优化。对于一些工作负载的种类,重复数据删除操作在这种方式下的性能可以有所提升。同样的,集成化也“相对容易一些”,设备只要你设置策略配置,而基于软件的重复数据删除技术则要求配置媒介服务器以提供相应的处理性能。
当然,设备也消除了生产服务器的负载,可以用于任何备份系统环境的重复数据删除“如果某环境中有超过一个备份解决方案,而又希望采用单一的重复数据删除策略,这是一种可选方式,”她提道。
Gartner分析师David Russell也有相类似的结论,不过他发现客户更倾向于重复数据删除软件。举例而言,Gartner最近的一次会议中调查了计划部署重复数据删除技术的意向,42%表示其愿意使用软件方式——Gartner所记录的最高百分比,也是一年前“低20个百分点以来”的一个突破性增长,他说道。
“考虑软件方式的想法是这样的,他们可以采购一台高性能的服务器安装软件,这样的成本会低于一台相应设备,”Russell说。此外,其指出“如果是一台设备的话,你很难再未来很好地扩展,你不得不担心你所需要的特定设备型号,以及供应商势头提供目标设备的网关。”
同时Russell认可在这一趋势中,基于软件的重复数据删除技术有一些问题。举例而言,过分地依赖于其部署方式。“我发现很多企业不知道如何进行规划和部署整个基础架构,如果你在空间和磁盘类型上规划的磁盘容量过小,就会降低基于软件的重复数据删除技术的性能,”Russell说道,“当有人看见软件实际上的运行不合理,比如在已经非常繁忙的Exchange服务器上运行重复数据删除,他们就会责备软件有问题。”他说。
“换句话说,基于软件的方式确实有优势,但它也可能让人自找麻烦,”他说。
有一种解决方案,他说,可以为一些诸如大型数据库之类的对重复数据删除有较高要求的环境部署相应设备,而对较轻量级的以及可管理的重复数据删除工作中使用软件。“在数据库之类的大型项目上运行重复数据删除会拖垮整台服务器,反之使用相应设备则是这种环境下的最优选择”他说。