重复数据删除技术助教育服务提供商削减硬件成本

面对如何降低昂贵的RAID 6硬件成本,厂商们已经找到了一种独特的技术,这就是目前市场中热度很高的重复数据删除技术。美国知名教育服务提供商Timecruiser公司通过利用重复数据删除技术,极大的减少了所保存的数据量,从而节省了RAID 6硬件的成本投入。Timecruiser预计,从现在开始到2010年,他们在硬件成本方面将节省近25万美元。

保存了全美将近80所大学的电子邮件、课程资料及学生课程论文的Timecruiser公司,当前所备份的客户数据通常会超过3Tbytes,如他们位于新泽西的客户Fairfield要求:要保存1-3年内的电子邮件,而学术论文则需要保留7年之久。

大量的备份数据和预料中的数据卷的爆炸,使Timecruiser公司的CTO James Wang希望在RAID6的硬件成本方面有所节约,“对我们来说,用来保存所有历史数据的存储(RAID 6)的数量太多了!”

RAID 6 通过附加的校验技术扩大了RAID 5对冗余阵列的支持,为潜在的多块硬盘同时故障的风险提供了保护。即使RAID 6已经比以前得到了更广泛的应用,这项技术的每个Mbyte的成本却非常昂贵,因为它需要额外的控制器的同时,每个RIAD组至少需要4块硬盘。

James Wang 意识到必须减少需要RAID 6磁盘的数据量才能节约成本。因此,他选择部署了飞康的VTL和飞康年初刚刚发布的用来执行重复数据删除的RAID 6 SIR (单实例存储)设备。对于Timecruiser来说,利用重复数据删除技术可以在每年轻松节约8万美元以上的成本,James Wang表示:“如果没有重复数据删除,我们每年都要再购买3-4个单个价值在1.5万到2万美元的阵列,那可是很大一比花销啊!”

此前,Timecruiser的客户数据是从一台7-Byte的飞康IPStor专用管理器备份到一个同样来自飞康的7-Tbyte的RAID 6阵列,但二者都不支持重复数据删除。而现在的客户数据是从IPStor专用理器备份到VTL,再通过光纤,从VTL发送到进行重复数据删除的SIR设备。而VTL和SIR设备的容量也都是7-Bytes.

James Wang认为利用重复数据删除减缓数据的激增是非常好的办法。“我们已经在生产系统中使用SIR将近三个月了,目前的效果非常好,我们希望今后可以有更多的数据进行重复数据删除。”

尽管没有透露具体价格,但James Wang还是证实,他们采购的VTL和SIR设备在打折后不超过10万美金,同时,他也表示这一成本投入在一年内即有望收回。Timecruiser公司非常信任飞康公司的存储产品,因此在采购重复数据删除产品时没有再对其它厂商的产品进行评估,然而James Wang对自己的选择非常满意。

飞康公司所采用的重复数据删除的方式可以被称作后处理(post-processing)方式,它在数据已经备份到备份服务器之后才开始工作。而市场中有些厂商提供的重复数据删除则是内处理(inline processing)的方式,即数据在备份到备份服务器的同时进行重复数据删除处理。后处理方式的最大优势在于不会降低备份的速度,因此对企业级用户更为适合,它可以在重复数据删除前用额外的磁盘容量保存数据。

对于VTL技术,James Wang认为无需担心,非常可靠。但是,对于重复数据删除这一新兴的独特技术,还是一项挑战,特别是对于Timecruiser这样管理着非常关键的学术数据的企业来说。“通过SIR的重复数据删除,我们只有一份单独的拷贝,因此这份拷贝的安全性变得更加重要。”而在以前,他们每天都会进行一次全备份。

为了使备份过程更具安全性,Timecruiser公司在目前的重复数据删除架构上增加了远程复制功能,可以将SIR数据复制到远程的飞康公司的PrimeVault 设备上。

James Wang也还提到了那些用SIR设备替代的阵列,已经被重新配置为RAID 10设备,现在用于支持Timecruiser 的其它的数据库。“相对于RAID 6, 因为数据可以在阵列内进行镜像,所以RAID 10 提供了更高级的可靠性。而这从利旧的角度来说,又给我们节省了不少成本。”