戴尔Ocarina重复数据删除如何走出荆棘?

Ocarina技术在戴尔存储平台中应用必须克服重重障碍,并且每个障碍都充满挑战。

Ocarina可以对文件进行重复数据删除——更确切地说,是优化和压缩文件——并且是内容感知的,因此它对于处理JPEF和PACS有着独特的方式。但是它不能对块进行重复数据删除,这就是症结所在。

戴尔希望在自己存储平台的文件级和块级部署Ocarina重复数据删除技术,不排除基于Windows Server、运行CommVault或者赛门铁克软件的DL磁盘到磁盘备份系统。戴尔存储副总裁兼总经理Darren Thomas坚信一切皆有可能。

文件重复数据删除

文件需求是最简单的,可以说是Ocarian的“主场”。戴尔可扩展文件系统(DSFS)已经随NX3500的发布正式引入PowerVault平台,随FS7500以NAS头的方式引入EqualLogic中。一个是针对Compellent,另一个是针对目标存储DX6000。戴尔将向这款设备中增加Ocarina重复数据删除技术,并且很快会将所有存储平台移至DSFS头下,时间是一致的。

Thomas表示:“把它想象成一个RAID功能。它是一项针对文件系统的重复数据删除功能。”

不过这并不包括DL阵列。戴尔知道,从DSFS阵列备份来的数据(文件数据)在发送到运行CommVault或者赛门铁克软件的DL产品之前不用进行再处理,这是可取的,但是这CommVault和赛门铁克的软件都不支持Ocarina。

据我们所知,CommVault正在考虑如何导入经过Ocarina处理的信息并避免再处理。据我们的研究,赛门铁克知道避免再处理的必要性,但是在与戴尔讨论该问题方面并不如CommVault积极。

Darren Thomas表示,戴尔占CommVault收入的20%~25%,所以可以想象戴尔的想法更容易触动CommVault,而对于规模更大的赛门铁克来说就不怎么行了。

Darren Thomas表示,这两家DL软件提供商还希望能够将备份数据导出到其他第三方系统中,这样就能够读取经过Ocarina处理的数据。这些系统将需要安装Ocarina Reader软件(只占很小一部分代码)。

块级重复数据删除

块的情况有所不同,比较难。不同的戴尔存储平台之间,多组块或者页的大小也是不同的。在EqualLogic系统中,一个块的大小是15MB,而在Compellent中则有不同大小,64位StorageCenter O/S在块级进行追踪。一个块并不是一个完成的文件,不过StorageCenter O/S原则上是可以查询哪些块组成了哪些文件。驱动器之间的文件条带增加了主存储块级重复数据删除工具需要处理的数据片段。

页或者块越大,发现其中冗余数据的概率就越高。

戴尔有专门的Ocarina重复数据删除专家致力于这项工作,他们开发了最初的Ocarina算法用于压缩其他重复数据删除可能接触到的数据,例如各种图像文件格式。他们现在正在开发一些算法,使其能够在页或者块中找到并移除冗余数据、回收释放出的空间。Darren Thomas表示:“如果你把15MB数据压缩到12MB,那么你必须恢复这些空间。也许这意味着对已经经过压缩的页再进行压缩。”

据我们了解,你可以读取页,对其进行重复数据删除,然后将其写回到磁盘中作为持续数据流,阵列软件再将这些数据流分解到各个页。

一旦开发出重复数据删除检测算法以及空间恢复算法,“我们将把它融入到EqualLogic和Compellent的操作系统中。到那时他们将作为独立的部分工作。”

这项工作的日程尚不明确。戴尔有信心可以实现想要的结果,有媒体猜测文件级Ocarina重复数据删除将在今年年底前出现。

你可以感觉得到,戴尔正在为摆脱以前人们总问戴尔是否是一家真正创新公司时的日子而高兴。现在戴尔拥有并在大力发展自己的知识产权。相信不久之后,我们将听到关于戴尔专利的消息,Ocarina研究人员将为其贡献自己的一份力量。