惠普融合存储:定义重复数据删除2.0

DOSTOR存储在线 7月11日原创报道: 惠普再一次证明,在存储市场这家公司是一个不容小觑的竞争者,而且,也不会坐视自己在存储市场的任何领域被竞争对手远远超越。

在今年6月举办的HP Discover 2012大会上,惠普发布了一系列涉及主存储、磁盘备份、存储软件、大数据等领域的更新,这家拥有最丰富也是最复杂的存储产品线的IT厂商借此向业界表示,惠普存储仍然富有活力且极具创新——尤其是在存储市场最前沿的热点上——更是如此。

惠普此次在存储上的发布主要集中在两个方面,第一是HP 3PAR存储系统,第二是HP StorOnce备份方案,前者是惠普通过收购获得的业界领先的中高端存储系统,现在已经成为惠普融合基础架构、惠普融合存储的核心;后者是惠普如今最看重,也是和竞争对手EMC、IBM竞争最激烈的产品线——处于市场开拓普及时期的磁盘备份市场——惠普从一开始就希望能够抢占先机,预先在市场埋下自己的“种子”。

这两类解决方案同样都服务于惠普的融合存储,并进而促进惠普融合基础设施理念的发展。而从另外一个角度来看,存储正在成为惠普融合基础设施架构中最为活跃的部分,在惠普过去一年的产品发布或是全球大会活动上,业界总会像此次Discover 2012大会一样,看到惠普存储有新的产品、技术、解决方案或是客户服务计划的发布。对此,中国惠普有限公司副总裁兼存储产品部总经理徐志钧表示,“现在的存储(系统)处在非常重要的地位”。

 

徐志钧, 中国惠普有限公司副总裁兼存储产品部总经理

徐志钧认为,存储在企业IT基础设施上的地位越来越重要,究其原因还是长期以来对“信息爆炸的时代”的共识,这也让企业IT基础设施的演进现在到了以存储基础设施为核心,需要加强企业IT基础设施融合程度的时代,他表示,在这个时代,数据无时不刻都以超越指数级的速度在增长,而另一方面,这些数据中的绝大部分,还在同一个时间点被复制到不同的地方——以无序和并不科学的方式——加以管理。

 

惠普存储正在逐步促进存储产品线内部各个产品线之间的融合

因此,对于企业存储来说,在过去十年基本上解决了在线存储的方式,块数据与文件数据的存储方式前提下,信息的保护与信息的发现、利用“已经是一个非常重要的课题了”,无论是大数据还是云计算,背后都有与数据的安全、数据的存储、数据保护及数据的利用有关的内容,而惠普存储的发展方向,也就是利用融合存储的架构,在企业存储架构中实现更好的存储、保护与利用。

“存储要最容易管理的、节省人工成本,简单来讲就是简单、高效、灵活,除了性能能够扩容之外,还能够扩容容量,要做到横向扩展。”徐志钧表示,无论是面向中高端存储市场的3PAR还是惠普在重复数据删除磁盘备份系统StoreOnce秉承的都是相同的产品理念,唯一不同的,是他们面向的是企业数据的不同生命周期的阶段,但即使是这样不同目的、不同形态的产品,惠普同样以融合的角度去设计和建构,从而实现融合基础设施。

 

面向主流市场的惠普存储以3PAR和StoreOnce为核心,惠普并不甘心在备份应用系统市场输给自己的老对手

而回到惠普存储的产品此次在HP Discover 2012大会上的更新,我们不难将其同样归为两类:前者是StoreOnce这一系统的巨大升级,目标是重复数据删除磁盘备份系统——数据保护领域的巨大潜力市场——的成功;后者是惠普以企业存储为核心,围绕融合基础设施的设计与构建,所推出的一系列更新与加强,从而实现服务器、存储与网络基础设施更深层次的融合。

50项创新引发重复数据删除2.0

曾几何时,在惠普刚刚推出StoreOnce重复数据删除磁盘备份系统时,业界和媒体关心的,还是惠普与Sepaton在VTL及重复数据删除技术上的合作,以及惠普将如何加大基于Sepaton VTL的重复数据删除技术的市场销售——很少有人关心当时还定位在中小应用环境、远程办公室等应用领域的StoreOnce。

但现在随着年度StoreOnce B6200的推出及HP Discover 2012大会上B6200增强版、惠普 StoreOnce Catalyst软件的推出,以及惠普借助StoreOnce引发重复数据删除2.0概念的市场举措,已经基本上没有人关心Sepaton的OEM业务在 惠普的发展前景——市场信号非常明显——未来的重复数据删除市场,是重复数据删除磁盘备份系统的,是StoreOnce的。

谈到重复数据删除2.0,中国惠普有限公司存储产品部产品经理张梅生表示,这一概念首先是通过StoreOnce的一系列升级与革新——共计50多 项的创新——所引发的,其中包括StoreOnce的适应性微数据块、预见性加速、快速恢复、横向扩展集群设计以及自动重启等产品革新。不过,张梅生也谈 到了两点重复数据删除2.0时代与1.0时代最大的不同。

?

张梅生, 中国惠普有限公司存储产品部产品经理

“在传统的重复数据删除架构里面,可以看到大部分的在线重复数据删除都采用的是单节点、单一控制器来完成重复数据删除。如果说用户的这边要求更高的 高可用性,要求服务级别、SLA的满足,这些都是在第一代的重复数据删除技术里面没有办法或者是很难解决的问题。”张梅生认为,重复数据删除2.0时代与 1.0时代最大的不同第一点就是“联合重复数据删除”,也就是通过单一联合重复数据删除引擎“在企业的任何地方都可以进行重复数据删除”,无论是把数据从 远程分支机构还是从应用服务器上传送到数据中心或是其他站点,重复数据删除技术——且是同一种重复数据删除技术——都能够派上用场。

张梅生认为,而在这一架构下,如果数据经过了一次重复数据删除,也就意味着“永远不需要复原或是复制时再复原再重复数据删除”,她表示,这一概念的 根本,是如果数据经过重复数据删除,每次复制到新的站点、数据中心、应用服务器或是其他平台,都不需要“复原-传输”的过程,无需复原即可实现数据的移 动。“把数据从应用服务器、备份服务器或是远程机构传到不同的地方的只需要处理一次,就可以把删除后的数据传输到数据中心去,一个单一的平台可以把企业架 构下所有数据保护的方案或者是设备都可以还原。”张梅生认为,“这意味着重复的数据一旦通过单一技术删除,就可迁移至任何地方且无需解除重复数据删除”, 而这相对于第一代重复数据删除是一个非常非常大的改进”。

?

基本上每一页内容,惠普都在和EMC对比,EMC Data Domain按照IDC报告显示,在备份应用系统市场遥遥领先

而第二点就是StoreOnce的横向扩展能力,惠普为StoreOnce提供了最多八节点的横向扩展能力,这也让这款产品有了极大的弹性空间和性 能跃升,对此,张梅生认为,StoreOnce随着数据不断增长而可以横向扩展到“大设备”的能力,可以充分的保护用户在数据保护方面的投资,用户不需要 “为未来购买未知的容量而提前准备”,从而节省了当下的采购资金。

与此同时,张梅生表示,重复数据删除磁盘备份系统的横向扩展,带来了“高可用”这一附加价值,原本的第一代重复数据删除技术以及磁盘备份系统,受到 技术和架构的限制,大部分只能够采用单节点的设计,无法形成系统级别的冗余,从而满足许多企业对SLA服务水平协议的要求和限制。张梅生认为,随着重复数 据删除磁盘备份系统的系统性能、容量及可扩展性越来越高,原本高端的VTL市场在不断被挤压,但重复数据删除1.0时代,大型企业的关键业务系统的备份因 为不能提供系统级冗余的保护性,无法满足许多大型企业关键业务系统备份的重要工作,“你不会在高端存储市场看到有单点故障的设备,所以我们提供的重复数据 删除2.0技术及StoreOnce更好地诠释了没有单点故障的架构的设计。”

正如上文所说,StoreOnce刚刚发布时是一个应用在中小型环境、远程分支办公室的磁盘备份系统,但在当时,惠普已经在路线图中规划了横向扩展 架构及更高的单点性能,张梅生表示,如今对这些路线图的实现,意味着惠普正在朝着StoreOnce既定的愿景前进,并逐步交付StoreOnce家族越 来越多的产品——说起交付StoreOnce产品家族的产品,增强型惠普StoreOnce B6200备份系统及惠普StoreOnce Catalyst软件是这一次交付的最新也是最重要的StoreOnce路线图上的革新。

StoreOnce:是否将引发市场厮杀?

StoreOnce的市场目标非常明显,那就是与惠普的HP Data Protector软件一起,在IDC所说的集成备份应用系统领域占据更多的市场份额,更多的在重复数据删除技术及重复数据删除磁盘备份系统领域,挑战市场领导者的“宝座”,但此次增强型惠普StoreOnce B6200备份系统及惠普StoreOnce Catalyst软件的发布,是否会引发市场一场新的厮杀?

“惠普StoreOnce 一天内恢复的数据量比 EMC 一个工作周所恢复的数据量还高。”在介绍StoreOnce B6200增强版的时候,张梅生态度强硬而且肯定,很明显的EMC成为了这一次惠普最主要的竞争对手,张梅生认为,不仅在联合重复数据删除和横向扩展能力 上,StoreOnce优于竞争对手,而且得益于此前的两个特性以及惠普在恢复速度上的研究投入,StoreOnce以“常规40TB每小时的备份速度与 恢复速度,借助StoreOnce Catalyst软件的100TB每小时的备份速度”超过EMC DataDomain的3倍和5倍,并继而降低了75%的每TB/小时的数据备份费用。

StoreOnce B6200增强版借助StoreOnce Catalyst软件可以实现100TB每小时的备份速度,提供10.2PB的逻辑容量,可用容量从32TB扩展到512TB。作为一款横向扩展的系 统,StoreOnce提供最多8节点的横向扩展能力,但需要指出的是,由于StoreOnce追求“冗余架构解决单点故障”,因此,用户只能选择1~4 组的B6200引擎组合,也就是至少配置两个B6200基础引擎组成一套基础系统。

“惠普更愿意基于一种横向扩展的架构基础给用户提供多节点、高可用、没有单点故障的设备,就现阶段而言,我们是一定要考虑在交付性能、高可用性和自动化重启上,这是我们现在发展的目标。”张梅生表示,当然也要高性能的数据保护解决方案之上来谈重复数据删除。

另外需要指出的是,惠普方面在提到B6200增强版的备份、恢复性能时特别提到,其备份速度和恢复速度同样为40TB每小时。一般来说我们都知道, 恢复速度都要比备份速度要慢一些,在重复数据删除磁盘备份系统上亦是如此,就此问题,张梅生表示,首先,就年初发布的B6200版本来说,备份和恢复速度 就已经是一样的;其次,这也是惠普在“50项StoreOnce创新上所取得的研发成果”,但具体的实现原因则不便透露。

如果惠普StoreOnce真的实现了备份速度与恢复速度在达到极致时速度相同,这显然是一个不小的突破,不过在此之前,StoreOnce在使用模式上的不同形式,则更加重要一些——这也是StoreOnce与EMC的Data Domain竞争的最主要的地方:用户到底能够获得哪些使用的灵活性?

据张梅生表示,与HP Data Protector及其他备份软件结合,StoreOnce主要包括三类使用方式:第一种是备份服务器之后的StoreOnce设备删除重复数据,无需还原数据即将数据传输到远程灾难备份站点上的StoreOnce系统;第二是备份服务器(结合HP DP或是其他备份软件)经过StoreOnce Catalyst重复数据删除的数据,通过广域网(WAN)备份到StoreOnce设备,或再进一步复制到灾难恢复站点;第三种则不再需要备份服务器,重复数据删除过程由安装了备份软件代理的应用服务器进行,然后将精简过的数据传输到StoreOnce。

三种典型应用模式

无论是以上哪一种方式,StoreOnce都是非常核心的灾难恢复或是数据加速平台,而从与HP DP7紧密结合的后两种方式上来看——无论是备份服务器还是应用服务器上的代理——重复数据删除工作都是交由StoreOnce Catalyst软件来完成的,从实现方式到部署模式,再到重复数据删除流程,StoreOnce与EMC Data Domain都非常相似,可以说两者的实现方式、理念都是基本相同的。

而不同的是,HP Data Protector 7此次的更新,与StoreOnce的联系非常紧密,而对于EMC Data Domain来说,无论是Avamar还是NetWorker,在近期都还没有大版本号的升级,这也成为了市场上质疑与关注声音最多的话题。

?

除了以双节点冗余单组销售到8节点4组的4种由低到高的配置覆盖市场,惠普还会在年底发布更趋向于中端的产品。

当然,HP Data Protector 7与StoreOnce Catalyst软件融合的意义并不仅仅限于提供两种应用模式。事实上,这两者结合之后,按照中国惠普有限公司信息管理技术顾问张卫华的话说:“HP Data Protector 7与StoreOnce Catalyst软件的结合,使得惠普无论是在数据源端、目标端还是备份服务器端三个端都可以进行联合的重复数据删除”。他表示,这一灵活架构让用户可以 选择在任何一个层次:StoreOnce端、备份服务器端、应用服务器端,进行“联合重复数据删除”之后的数据都可以在各个设备间流转而无需进行还原,给 用户提供了最大的灵活性和重复数据删除备份性能。

HP Data Protector 7在软件上的更新——既然是大的版本号——不是修补或是增强的升级,张卫华表示,HP Data Protector 7的升级有“很多革命性的更新来帮助用户解决传统备份软件无法解决的大量问题”,而其中最重要的就是HP Data Protector 7与惠普收购的Autonomy的语义识别功能的融合——这也引出了此次惠普存储产品更新中,那些“与融合有关的事儿”。

惠普存储:以存储为中心 融合!

“随着HP Data Protector 7的发布,我们通过所并购进来的公司Autonomy结合我们的备份产品HP Data Protector 7实现了智能的基于语义的备份保护。”徐志钧表示,Autonomy的加入让惠普的备份恢复解决方案更具效率,能够按照语义式智能的实现文件或数据的恢复——这一结合显然是以增强HP Data Protector 7的功能、速度为核心的,换句话说,是Autonomy的能力被融合进了惠普的HP Data Protector 7软件。

这也是当下惠普融合基础设施架构的一个缩影,越来越多惠普的技术、产品被融合到惠普存储,而惠普存储也越来越多的在惠普CloudSystem、VirtualSystem中扮演重要的角色,无论是硬件还是软件。

随着Autonomy的IDOL 10信息管理平台融合到HP Data Protector 7中,徐志钧表示,将让HP Data Protector 7实现“有目标的恢复、更快速的恢复以及实现更智能的信息管理”,他表示,Autonomy让HP Data Protector 7的数据恢复操作精确的定位到与所需内容“语义”相同的信息——基于语义管理数据——从而很大程度上优化恢复。

而另一方面,HP Data Protector 7与Autonomy IDOL 10平台的融合,其能力也被带到与StoreOnce结合的联合重复数据删除平台上。据介绍,基于StoreOnce 联合重复数据删除和 StoreOnce Catalyst 集成,HP Data Protector 7与Autonomy IDOL 10平台的融合能够提高效率和性能,并未所有备份建立索引,让所有备份的数据拥有语义。

可以说,这就是Autonomy IDOL 10融合到惠普存储的一个重要途径和充分的体现。

如果谈到惠普存储的融合,HP 3PAR自然不能忘记。在CloudSystem、VirtualSystem中,选择什么样的存储系统——P4000系列还是HP 3PAR——是决定系统级别很重要的区分,像是惠普前不久推出的HP CloudSystem快速启动包就除了提供了各种不同的IT基础设施、运营系统和管理程序的选择,还整合了HP 3PAR F-Class存储阵列、HP CloudStart Solution Services、HP CloudSystem Enablement Services以及惠普金融服务。在这其中,HP 3PAR F-Class存储阵列可以说是该“快速启动包”与其他CloudSystem最大的区分。

从融合的另外一个角度:管理层面来看,惠普将统一3PAR与HP CloudSystem的服务管理架构,使得3PAR和HP CloudSystem的整合能够集中管理服务器、存储和网络资源,惠普方面也曾表示,未来的这种融合,将包括提供自动精简配置、分层存储功能的存储资源目录单一控制台,客户能够轻松管理跨越不同服务器、存储和网络的云基础设施。

而这一次,惠普则从网络的角度,去将存储更好的融合到企业的IT基础设施中,或者说,是以存储为中心——基于扁平化的SAN架构——搭建一个“融合的IT基础设施”,而非以服务器或是计算网络为中心。

?

扁平SAN架构,主要依靠的还是融合网络设施

面对当前SAN环境的连接复杂性,惠普宣布在其云存储平台3PAR系统上引入了Flat SAN(扁平化SAN)技术理念,该技术利用HP Virtual Connect虚拟附加光纤通道技术,取消了原来SAN架构中的交换机层,实现了SAN存储与服务器点对点直连,简化了SAN架构、提高了性能,并节省了成本与能耗。

利用HP Virtual Connect虚拟附加光纤通道技术,HP 3PAR存储可之间接入HP VirtualSystem,与HP BladeSystem共同组成这一系统,而不需要复杂的SAN交换层,中国惠普有限公司工业标准服务器产品部产品经理安源表示,扁平化SAN不仅会节省 非常多的线缆、交换机及这些设备的配置、安装时间,最重要的是可以避免用户陷入传统SAN的复杂性中。除此以外,安源表示,HP Virtual Connect虚拟的不仅是网络,同样虚拟的也是端口,这提升了用户在网络连接、网络端口配置时的灵活性。

以存储的角度来看,HP Virtual Connect很大程度上简化了SAN存储网络,并且将SAN存储更快的接入到惠普的VirtualSystem中去。这一技术最重要的就是让存储离计算 更近、更直接以及更快速,很大程度改变了原有VirtualSystem中存储连接的复杂性,可以说,也是在融合基础架构中,让存储更好的融合到整体企业 IT基础设施中——这是一个以存储为核心,或者说是存储融合为目的的网络连接的更新。这不仅可以看出存储复杂性被简化的迫切需求,也可以看到存储在融合基 础设施架构中的重要作用。

不过,安源也表示,为了存储去融合网络,推出HP Virtual Connect并非意味着用户的SAN基础设施连接都要以此为参照蓝本,她表示,既然惠普要做融合,就要“兼容并蓄各种网络”,只要是用户基础设施中涉及 到的连接方式,特别是SAN存储或是其它核心数据的接入方式,惠普都会不遗余力的支持,“融合的意义首先就是要解决用户存储沟通的问题”,安源表示。