专家博客 重复数据删除API将成为市场热点

在主存储的重复数据删除价值上,我认为,很多存储厂商都已经了解了其益处并致力于此。当然,这一过程可以通过第三方设备实施,但许多厂商还是在试图自己完成。不过,如果他们没有充分技术实力的话,其开发周期可能过长,这会有全盘皆输的风险。为了填补这一需求,我们看到少数厂商试图通过API方式来重新定位重复删除市场。

重复数据删除,甚至主存储的重复数据删除都不是一个全新的功能,很多操作系统和NAS厂商很早就推出了相关功能,不过这一技术肯定是要比备份技术更年轻。很显然,用户对此技术很关心,因为其可以带来潜在的效益。而作为API的重复数据删除技术可以允许厂商将其嵌入到他们现有的存储源代码中。这不仅给厂商提供了一个拥有必不可少技术的快捷途径,而且,也许更重要的是,能够更好地控制数据存储。

对重复数据删除流程的控制和知识可以被证明是非常有价值的。举个例子,赛门铁克OST就改变了备份应用与磁盘存储设备之间的交互。备份应用程序能够控制设备的话,就会使得整个过程变得更为顺畅。以同样的方式,存储系统一旦拥有了重复数据删除过程的控制权,那么就会更好地使用这项技术。例如,存储系统可以处理所有的在线数据,而且对效能的影响并不明显,如果I/O出现变化则立刻转移到后处理。以同样的方式,厂商可能利用API的权衡来提供比以前更聪明,更有效率的SAN复制模式。同时其也可以不再发送已经从另一个站点发送出来的数据,这就同如今一些备份产品的做法一样。

不过,对于供应商来说在一些问题上依然会存疑,比如什么情况会对系统性能产生影响?API复杂性如何?换句话说多久可以把API整合?另一个问题将是数据修改的影响。虽然API可以很容易将将重复数据删除功能打开,不过你是否可以关掉它?这样做又有什么影响?这将是一个关键问题。

我相信主存储重复数据删除将在未来一两年内如同现在的主存储快照一样普及开来。如果在这个时间框架内供应商不能获得重复数据删除技术,那么他们就必须寻找API的解决办法。谁都不想用过时的技术对抗新兴产品。