惠普StoreOnce:叫板EMC备份组合实力?

IDC的2011年全球专用备份设备市场份额统计,EMC凭借着Data Domain、Avamar的前期努力已经占据了压倒性的优势。不过我们应该看到这还是一个处于发展中而未完全成熟的市场,因为竞争对手之前给予的重视还不够,像惠普这样的厂商仍在完善产品线布局的过程中,而戴尔可以说才刚刚开始试水。

我们认为,EMC仍然会在未来3、5年甚至更长的时间排在第一位。但正如目前他们在外部存储系统市场中30%左右的占有率那样,同样没有哪家厂商在重复数据删除磁盘备份领域有绝对的技术优势,而且参与者众多。不出意外的话,EMC去年65.5%的份额将有一部分会陆续“流失”到其他厂商,那么以惠普4.1%、戴尔1.0%的基数来看,可以增长的空间还是蛮大的。

不过在我的脑海中,关于惠普整个去重备份产品线还有一些疑问:

1. StoreOnce Catalyst软件目前只提供对B6200的支持,未来会支持定位较低的StoreOnce 2500和4000系列产品线吗?

2. “根据惠普对公开数据和专家意见所做的对比,据Evaluator Group称,对于大多数竞争对手来说,恢复大约是吸纳性能的50%。”惠普的StoreOnce和EMC DD等重复数据删除技术都属于in-line(线内)的处理方式,为什么惠普的恢复速度能达到与本机备份速度(不使用Catalyst)相同的水平?

3. B6200 StoreOnce的8个节点(4对)配置一共有4个单独的重复数据删除索引,将来会合并到一个全局重复数据删除池吗?

4. “HP Data Protector 7软件采用Intelligent Data Operating Layer (IDOL),配备管理工具提供情境性备份和恢复功能。客户第一次能够基于数据的语义和概念来精确地保护、寻找并恢复信息。”这里应该如何理解“语义”?

5. 惠普凭借StoreOnce单一技术,是否具备全面挑战EMC Data Domain + Avamar + Netwoker产品组合的实力?

下文中,笔者将陆续尝试解答这些问题:

惠普StoreOnce单一技术:叫板EMC备份组合实力?

最小配置的HP StoreOnce B6200备份系统(从后方拍摄)

近日,在惠普大厦9层我第一次看到了StoreOnce B6200的真机。照片里,中间的2台服务器引擎节点分别通过2块SAS HBA卡上的接口,连接最上面和最下面的两台P2000 MSA阵列的双控制器上,以实现冗余。

StoreOnce Catalyst支持将扩展至全线

惠普StoreOnce单一技术:叫板EMC备份组合实力?

最新的惠普存储备份软、硬件产品线

曾经有业内人士对笔者表示:像EMC DD990、惠普B6200和SEPATON S2100-ES2这些高端磁盘备份系统,面对的用户群和市场相对比较小,而主流和中低端产品的需求量则大得多。我们曾经对比过惠普的StoreOnce Catalyst和EMC DD Boost这两种将数据传输至专用备份设备之前,在应用服务器或备份服务器上预处理重复数据删除的技术。DD Boost从开始推出就支持Data Domain全线产品,而StoreOnce Catalyst目前只支持B6200。

如上图,对于StoreOnce 2500、41XX和43XX(即D2D系列),惠普计划在今年底支持StoreOnce Catalyst。

B6200的本地备份(不使用StoreOnce Catalyst时)和恢复速度最高都是40TB/小时,这里还可以看到StoreOnce 2500和4000系列的恢复速度大约为备份速度的80%。再联想到B6200的本地性能从一开始发布时的28TB/小时提升到40TB/小时,通过的是 软件算法优化而不是硬件更新。笔者想在这里重复申明一点:所有厂商宣称的性能指标都可能是在理想环境下测试或者推算得出,而用户实际体验到的速度会受到数 据类型等多种因素的影响,惠普等也不否认这一点。

我们还曾提到过,IBM TS7650G ProtecTIER重复数据删除网关最近更新后的性能为9TB/小时,而其持续恢复性能比备份性能还要高(3200MB/s vs. 2500MB/s),达到了11.4TB/小时。这些可能与每一家厂商采用了不同的测试方法有关。

至于Data Protector 7备份软件的1.8TB/小时,这是利用备份服务器或者应用服务器(源端去重方式)的处理资源以纯软件方式进行重复数据删除的性能,并且该数字可能会随着硬件性能的不断增强而提高。

B6200与StoreOnce 43XX之间的速度和容量差距都达到或者接近了10倍,那么它们之间的空档由什么来填补呢?EMC Data Domain产品线通过单个节点不同的性能规格等来区分定位,惠普则有些不同,其整个中高端产品线,可以说是由B6200的横向扩展来覆盖的。

对于我们在文章开头提到的“B6200 StoreOnce的8个节点(4对)配置一共有4个单独的重复数据删除索引,也就是说全局命名空间下的4个池之间的冗余数据不会得到去重处理”。这一点得到了中国惠普有限公司存储产品部产品经理张梅生女士的认同,她还表示未来还有(在统一管理基础上)进一步整合的计划。

惠普StoreOnce单一技术:叫板EMC备份组合实力?

惠普StoreOnce B6200性能规格表

用户可以选择购买1~4组B6200基本引擎对(Base couplet),即2台服务器加上P2000磁盘阵列,上表中分别为本机和带有StoreOnce Catalyst License情况下的最高性能水平。笔者就不多解释了。

单一技术挑战EMC DD+Netwoker+Avamar

惠普StoreOnce单一技术:叫板EMC备份组合实力?

根据这张图,最上方的代表在StoreOnce设备上经过重复数据删除的数据,无需还原直接以精简后的状态通过广域网复制到灾难恢复站点的StoreOnce设备。中间则是在Data Protector 7或者赛门铁克备份服务器上经过StoreOnce Catalyst重复数据删除的数据,通过广域网(WAN)备份到StoreOnce设备能够节约带宽,还可以再行复制到灾难恢复站点。最下方即“源端重复数据删除”,去重工作直接在安装DP7代理的应用服务器上进行,然后经由WAN(当然也可以是数据中心内的LAN)备份到StoreOnce设备。

笔者注意到这里的源端去重流程不再经过备份软件的介质服务器,也就是不像上面那些传统的3层架构,而是简化的2层架构。以EMC的产品为例,Avamar源端重复数据删除方案可以包含硬件,也可以在应用服务器上通过软件直接备份到存储设备。而在Avamar与Data Domain配合工作时,就需要DD Boost的支持。

按照同样的方式来理解,惠普Data Protector 7代理与StoreOnce设备之间的去重配合也是由StoreOnce Catalyst来实现的。因此我认为在DP7之前的版本应该不支持这样的源端重复数据删除,这一点得到了惠普的确认。

以此类推,中间的方案对应了EMC的Netwoker(DD Boost)+ Data Domian组合;而上方的对备份软件就没有限制了。

惠普在官方新闻稿中表示:“包含HP Data Protector 7的惠普StoreOnce Catalyst软件让远程地点的应用服务器可以把重复数据删除后的备份直接传输至中央数据中心,无需额外硬件即可在本地保留副本以便进行快速恢复。”

惠普StoreOnce单一技术:叫板EMC备份组合实力?

根据上面这张演讲资料,可以看出Data Protector 7软件采用的Intelligent Data Operating Layer (IDOL,智能数据操作层)技术来自惠普花费超过100亿美元巨资收购的Autonomy。对“基于语义的保护”,惠普是这样说的:

“采用Autonomy IDOL,全新HP Data Protector 7软件提供业内唯一基于语义的信息保护解决方案。HP Data Protector 7软件自动理解数据中的概念,这将显著改变数据保护的范围和优势。现在用户可以检索到所有与特定想法或主题相关的信息,无论是关键字还是其他搜索参数。”

根据笔者的理解,所谓DP7与IDOL的结合,就是提供了在重复数据删除的索引中,根据关键字或者其它参数来搜索想要恢复数据的功能。而在此之前, 人们只能恢复整个数据集,或者在备份的目录结构中手动查找文件等目标。也可以说这一点有些类似于Windows搜索等工具或者像Google、百度那样搜索引擎。

与EMC竞争——HP StoreOnce任重道远

最后,我们再看一下市场方面的情况。

惠普StoreOnce单一技术:叫板EMC备份组合实力?

来自IDC的2011年全球专用(磁盘)备份设备市场份额统计