惠普StoreOnce软件:去重易,一统难

在今年6月的HP TECHFORUM 2010上,惠普宣布推出其第二代重复数据删除软件HP StoreOnce,是个值得关注的动向。

之前惠普在重复数据删除技术上的姿态较为低调,2008年推出第一代重复数据删除技术Dynamic Deduplication(动态重复数据删除)时,就没有在业内掀起什么波澜。

倒是不难理解,因为惠普的这个“动态重复数据删除”装备在HP StorageWorks D2D备份系统中,包括1U机架规格的D2D2500和2U机架规格的D2D4000,定位在中小型企业(SMB)市场;而在企业级市场,惠普虚拟磁带库系统(Virtual Library System,VLS)的OEM合作伙伴SEPATON,一并提供了DeltaStor重复数据删除技术。

从高到低,惠普集成到硬件中的重复数据删除技术组合,看起来是很完整了。问题在于,技术来自两家厂商,而且是完全不同的实现方式:Dynamic Deduplication是基于哈希算法的线内(in-line)块级重复数据删除,而DeltaStor则是面向对象的后处理(post processing)重复数据删除。

孰优孰劣?且不说在这两年的发展中,线内的实现方式逐渐占据上风,单以当时Dynamic Deduplication“基于HP正在申请专利的重复数据删除算法”的描述来看,即可知“孩子是自家的好”……

当然我们还必须提提这两年间重复数据删除市场的发展:慷孚(CommVault)以Simpana 8掀起了全局重复数据删除的潮流,而一年前围绕线内重复数据删除技术代表厂商Data Domain展开的竞购战不仅赚足了眼球,花落EMC之后更成为推动其今年业绩大幅增长的新生力量。

重复数据删除解决方案的整体性和重要性都已显而易见,惠普如果不想让这个市场成为自身的短板,必须尽快明晰战略,并坚决贯彻之。

思路很明确:沿着Dynamic Deduplication的方向走下去,但不仅仅是完善那么简单。

于是,就有了以单一、通用架构为卖点,以允许同一软件应用在客户端备份、虚拟设备、线内(in-line)设备和向外扩张的存储系统上为目标,基于HP Labs正在申请专利的技术而开发的……HP StoreOnce重复数据删除解决方案。

那么,HP StoreOnce是否能有上面说的那么好?或者,何时能够兑现承诺?带着这些问题,笔者采访了惠普公司存储产品部全球D2D/StoreOnce市场经理Andrew Dickerson。

ZDNet存储时代:看起来,StoreOnce与Dynamic Deduplication有很多相似之处,包括线内的实现方式、惠普的专利技术等。那么,StoreOnce作为第二代技术,是算法发生了重大的改变,还是主要体现在一个更为市场化的名字?

Andrew Dickerson:从深层次来说这两种技术有很多不同点,StoreOnce技术融入了HP很多知识产权。另外StoreOnce和Dynamic Deduplication也是兼容的,所以我们现在帮助很多Dynamic Deduplication的客户规划了平滑过渡的路线,而且原来在Dynamic Deduplication里所需要的功能到了StoreOnce里面仍然能够继续享有。这两代技术在架构上有很多不同,而且我们也确保了这两种技术的兼容性,正是由于架构上的变化和改进,使得StoreOnce能在客户整个IT基础架构中工作。

旁观解读:虽然有着“一统天下”的宏大志向,但目前StoreOnce还是与Dynamic Deduplication一样,紧紧地与HP StorageWorks D2D备份系统联系在一起。当然两年的功夫不是白过的,StoreOnce的硬件平台有了很大的提升,突出表现在加入了4U机架规格的D2D4312备份系统。D2D4312能容纳12块3.5英寸1TB SATA硬盘驱动器,裸容量12TB,支持RAID 6,可用容量9TB;最多可连接3个D2D4112/4312扩展单元,裸容量达48TB,可用容量36TB。

D2D4312的容量很快还会提升一倍,因为现在企业存储系统中支持2TB硬盘驱动器已成为普遍现象。Andrew Dickerson表示,接下来半年中马上可以看到新产品能够支持使用2TB硬盘的客户系统,而且这样一来新产品必然会在容量上和性能上都带来更大的空间。另外在产品进一步演进的路线图中,客户容量和性能的各种组合都已经考虑到了,将来的产品对客户容量和性能的组合会全方位的去满足。

有了更“给力”的硬件平台,作为软件的StoreOnce也就可以提供更为完善的功能。新的D2D备份系统支持VTL和NAS两种使用方式,而旧的系统在NAS方面仅支持CIFS。原因不难理解——入门级系统基本上只用考虑Windows环境。新的系统加入了对NFS的支持,可用于Linux乃至Unix环境。

ZDNet存储时代:StoreOnce最有价值的一点就在于它一体化的架构,从愿景来看,在各个地点惠普未来所有产品可能都会涉及重复数据删除技术,用到StoreOnce,但是StoreOnce现在还是集中在SMB市场,企业级市场上用的是SEPATON的技术。在D2D产品的介绍里,惠普介绍StoreOnce技术的一些优点,是拿企业级产品(VLS中应用的DeltaStor)技术作为参照对象。既然认为DeltaStore的技术并不是很好,为什么企业级产品还与SEPATON合作?很关键的一点就是其DeltaScale架构能够提供很高的性能。目前D2D4312备份系统峰值性能是2.4TB每小时,正如上页StoreOnce的愿景所示,如果把D2D的产品线配上横向扩展(Scale-out)的存储架构,理论上有可能替代现有的VLS企业级产品。所以,不知道未来规划是怎样达到这样的性能?

Andrew Dickerson:这个问题分两部分回答。今天我们正在开发并着力交付使用StoreOnce技术的高可用、多结点、高容量、高性能的企业级产品。这也就意味着StoreOnce技术的客户群也在拓展到企业级市场。在接下来的12个月中,将会看到StoreOnce出现在企业级产品中。

对于这个问题的另一部分,一定要强调StoreOnce技术产品会扩展到企业级客户中,但是惠普在客户级现有的VLS产品系列绝对不会中断,因为现在企业级产品为客户带来了真正的价值,而且也有非常良好和强大的客户群在用这个技术,所以惠普没有任何时间表去停用现在的这一代的企业级产品。

旁观解读:在稍后回答另一个记者关于SEPATON合作前景的问题时,Andrew Dickerson用了“永远不会……”的字眼,笔者开玩笑地说“Never say never”,因为比较“纯洁的”OEM合作关系实在难说永远。不过,具体到StoreOnce,要实现“同一软件应用在客户端备份、虚拟设备、线内(in-line)设备和向外扩张的存储系统”的长远目标殊非易事,特别是企业级市场绝非一日之功。因此,惠普有可能还要在相当一段时间内,同时维护着两种不同的重复数据删除技术。

第三大问题是StoreOnce在备份软件中的应用。从本文中再三提起的“同一软件应用在客户端备份……”来看,惠普是计划在其Data Protector(DP)备份软件也应用StoreOnce技术的。从备份软件的层面来说,赛门铁克(Symantec)的NetBackup(NBU)或Backup Exec备份软件不仅自身集成了重复数据删除功能,还可以通过OST(OpenStorage Technology)API对具备重复数据删除功能的设备提供更好的支持,而HP Data Protector显得相对滞后。或许就现阶段而言,惠普D2D备份系统与NBU或Backup Exec相配合,在重复数据删除上的效果会更好?

Andrew Dickerson没有正面回答这一问题。他坦承D2D备份系统的HP StorageWorks OST插件集成了赛门铁克备份软件的去重后复制(de-duplicated replication)功能,全面支持则要到明年才能提供,但不是出于保护Data Protector的考虑,而是从开发周期上要分出轻重缓急,有一个先后顺序。