EMC VPLEX专访:让数据在私有云自由流动

DOIT原创报道: 2009年,随着曾经高度机密的Hulk和Maui计划正式成为Atmos项目,EMC被认为在云计算领域,尤其是公共云计算和云计算硬件基础架构上面领先了竞争对手,而许多云服务提供商选择Atmos作为其云计算基础架构的举动,对Atmos在过去一年的发展更是极为有利,但在2010年,从EMC World上的一系列发布不难看出,EMC显然认为,私有云的市场将会更加值得期待,如何占领私有云市场,向那些希望拥有私有云架构的客户输出技术、产品和理念,将会是EMC的一次极大的机会。

EMC在一年一度的EMC World大会上不遗余力的在推广私有云的概念,乔图斯更是认为,私有云将是那些希望跨地域、大范围业务运营企业的必备,对于那些云计算和云服务的观察家们来说,乔图斯和EMC公司整体对私有云的热衷和笃信,简直可以用“狂热”来形容——至少这种狂热吸引了全球媒体和企业用户的关注。

EMC高端产品技术支持顾问王彦飞

VPLEX如今是EMC在私有云领域最大的砝码——早在去年5月就已被EMC注册为美国联邦商标——这或许能充分体现出EMC对VPLEX的重视和其研发时间开始之早,它被描述EMC为“用于数据管理和数据存储的计算机硬件和计算机软件”,乔图斯称,VPLEX是“推进私有云建设和IT即服务的关键一步”。

与侧重于连接和可见性的InVista不同,VPLEX的目标,将是如大型机连接技术那样,将无数的存储系统——甚至是竞争对手的虚拟存储系统或虚拟卷控制器——整合起来,形成一个分布在世界各地的“单一系统”。

私有云的新需求:让信息自由流动

如果说EMC最新推出的支持子卷级数据移动的FAST2.0分层技术,解决了阵列内的数据迁移问题,那么VPLEX的设计初衷,就是“把信息从物理存储中解放出来,使信息可以跨阵列、跨数据中心进行自由的流转”,EMC高端产品技术支持顾问王彦飞表示,EMC将这种数据的自由流动称为“虚拟存储”。

EMC认为,私有云有几个先决条件,其中,数据的自由流动且可控,是非常重要的。

“一直以来我们的客户都是通过物理存储来满足信息需求,但是这种物理存储或者说基于物理存储构建物理数据中心有很大的缺陷即物理中心是有边界的,换句话说放一个物理存储设备里的数据想迁移到另外一个设备,或者数据中心A的数据想迁移到数据中B。” 王彦飞说,从“全自动存储分层的工具”FAST到VPLEX,EMC的目的就是让用户通过数据的流动,获得许多“以前无法想象的好处”,比如,是跨越大洋,跨越几千公里,大规模的迁移数据中心,让信息与数据能够随意的从大洋彼岸的数据中心迁移到近在咫尺的数据系统中。

2007年,一家名为Yota Yota公司,将能够将数据迁移超过100公里的产品卖给了AOL,其支持长距离的数据传输的令人惊奇的能力,让业界十分震惊??EMC通过购买技术授权从YotaYota获得了许多相应的技术??但时隔三年,Yota Yota已经不知所踪,而这项名为GSX 3000 NetStorage Control Node的产品,则更是鲜为人知。

王彦飞将此归结为用户需求的原因,“2005年Yota Yota推出这种产品,但2005年用户没有这种需求,哪有跨数据中心需求?私有云的兴起也是最近两、三年,而且私有云概念被一些大企业接受得比较快。”他认为,“正是有了用户这样的需求,所以这样的产品才会有成绩。”

在整个VPLEX中,分布式缓存一致性是最重要的特性,其能够保证多个点上的VPLEX引擎的数据一致性,也令业务连续运行和迁移实现可能,此外,企业支持了VPLEX的Active-Active的应用方式。

过去的两年,是私有云被用户、厂商和媒体热炒的两年,而这种热炒的背后,也显示出私有云这种能够“将分布在大范围内的多个数据中心进行整合,以服务的形式提供IT资源的方式”对用户有着极大的吸引力,而在用户对数据中心的分布要求越来越广阔的形势下,数据如何从A点到B点,从一点到多点,从一个数据中心到整个私有云的要求,都愈发强烈。因此,EMC在此时推出VPLEX可谓正是踩在了点子上。

用户采购VPLEX的主要收益,其中几点可能最引人注目,包括能够管理其它供应商的产品,横向扩展,以及数据的透明、平滑的迁移

但VPLEX现在已经有了许许多多的竞争对手,无论是理念、架构,还是技术、产品,私有云的这块蛋糕,数据流动、迁移、保护的这块蛋糕,都已经有了许多的竞争者,而在借助Atmos推动共有云的期间,EMC看起来只有一个追随横向扩展热点的V-Max,数据迁移?让数据自由流动?无论是FAST1.0还是Atmos,显然都难当此任。这不是它们应该做的事情。

现在,VPLEX的出现,能够在多大程度上完成EMC赋予它的希望呢?

VPLEX:需要澄清的与需要解释的

对于VPLEX来说,同样对竞争友商异构平台的兼容,同样对存储容量等资源的统一控制,同样是存储虚拟化,很多人认为EMC将会停掉之前的存储(网络)虚拟化平台InVista,王彦飞表示,正如EMC World上帕特基辛格所言,VPLEX和InVista所面向的对象并不相同,VPLEX所面对的客户更高端,且其使用目的是为了最终将异构、异地的数据管理起来并远距离传输出去,而InVista则更侧重对网络上的存储设施的识别和建立联系,利用容量。

VPLEX的四个版本其基础都是这个VPLEX引擎,可以认为其是一个固化在硬件里面的存储策略和管理软件。

“目前市面上像SVC也好,像Invista也好,我认为是面向中低端的存储,真正的核心业务没有拿他们做虚拟化。”王彦飞显然预料到会碰到VPLEX和InVista之间关系的有关问题,他表示,EMC的VPLEX“希望把用户核心业务的内容接管过来”,同时不需要依附高端存储,而是“真正的存储虚拟化的产品”??“只是在高端存储附加了一个功能,就相当于买了手机附加摄象头可以照相,但不是真正的照相机。”王彦飞这样打比方介绍VPLEX到底是个什么东西??它不是一个存储系统,更多的情况下,VPLEX是一个存储管理器。

VPLEX的核心:分布式缓存一致性技术

此外,VPLEX也不仅仅支持EMC的高端Symmetrix阵列,支持V-Max的版本也将会很快的在今年第四季度发布,而对于竞争友商来说,EMC目前支持的型号,如IBM的DS8000,只是第一批列表,由于VPLEX采用SNIA所建立的SMI-S标准,所以理论上业界支持此标准的产品都可以支持。

只是,对于中端和低端产品来说,或许并非是用户需要远距离迁移的数据的合适载体??需要远距离迁移的数据理所应当在更高端和大规模的系统上,何况仅仅使用中端系统的用户,想必不会有太多多个数据中心甚至是全球范围内数据传输的要求??虽然VPLEX每个引擎的价格只有不到8万美元,与实现横跨几百公里的功能相比,确实不能称之为贵。

除了一些误解,王彦飞和EMC大中华区市场及渠道战略总监梅敏玲在极力的解释它的定位到底在哪个市场上。

EMC大中华区市场及渠道战略总监梅敏玲

“这是大型数据中心的应用,起码有多个数据中心。我们在美国跟欧洲都有一些试用客户,都是银行这种大客户。” 梅敏玲和王彦飞表示,VPLEX并非针对中小规模环境,因为它们并没有这么长距离传输数据的需求,“越是大数据中心的用户VPLEX的优势越明显,比如将来实现Global时,可以实现应用程序按成成本最低的地方跑。比如我现在在美国,电费很贵,中国电费很便宜,我就扔到中国数据中心去运行。比如这个应用程序需要做调整,我请一个美国工程师很贵,可以扔到中国或者其他成本很便宜的地方来做。跨地域越广,差异性越大的情况下,跨数据中心的应用迁移优势就越明显。”王彦飞如此解释VPLEX到底对用户的获益方面如何有所帮助。

VPLEX的体系结构,所有的引擎都能够访问所有的存储系统,这是VPLEX保证数据一致性和性能及数据保护的技术。

除此以外,王彦飞说,VPLEX是用户在拥有多点数据中心后,对抗自然灾害的一个好办法。

“我们以前做的异地容灾点承担的责任是灾难发生后有一个数据可以用来恢复系统,但是灾难发生的时候别无训练,而我们这个多一个选择,比如知道数据中心过两天可能要来龙卷风,以前只能硬扛着,但现在我可以提前迁移,等龙卷风过去了再回来。”他表示,从这个角度讲,VPLEX的Geo和Global可以实现风险的规避。而基于阵列的复制只是最后一道保障??“还没来得及跑就死了,用户(通过VPLEX)还可以有另一种方案保证数据的完整性。”

王彦飞同时透露,VPLEX目前支持博科和思科的网络设备,此外,VPLEX的连接方式未来有可能引入包括FcoE在内的其它连接方式,但王彦飞并没有详细介绍这方面的内容。

VPLEX到底是什么?

“(VPLEX)采取了EMC引擎,这个架构中一个引擎包括两个控制器,组成高可用性方案,每一个引擎包括32个8GB端口,有16个前端、16个后端,包括4个4核CPU,64GB缓存,和其他引擎互联的端口。硬件上也集成了冗余电源、备份电池以及Call home等功能。”王彦飞表示,每个VPLEX集群由1-4个VPLEX引擎构成,用户可以初始购买1个VPLEX引擎,即可实现VPLEX的功能。

王彦飞表示,VPLEX如今发布的两个版本已经为业界所熟知,EMC将Local称之为“单集群”,可以实现N+1性能,N-1缓存,有8000个虚拟化LUN,采用缓存直写以保留阵列功能性。支持的阵列包括EMC、HDS、IBM等一些主流平台。而Metro是“8个引擎化引擎,16000个虚拟化LUN,在数据中心内或跨数据中心转移、共享,同步距离,支持主流的主机技术。”他表示,“一个引擎是一个控制器,如果是两个引擎就双倍,如果四个引擎是在两个引擎的基础上再翻倍,这体现了横向扩展的特点,每加一个引擎,性能是成倍增加。”

披露的VPLEX引擎的硬件配置以及支持的竞争友商的产品列表,虽然大家都支持SNIA制定的SMI-S标准,但连接和管理竞争友商的产品,EMC还是需要和原来的供应商进行艰苦的谈判,以保证技术的兼容性。

而在实现跨地域的数据迁移和同步方面,EMC提出了被称为“分布式缓存一致性的技术”,王彦飞表示“分布式缓存一致性可以实现我们所有的引擎整合成一个大引擎对外统一提供服务,而且可以实现所有负载跨引擎的平摊或者进行时效转移。来自任何一个主机的I/O请求可以通过任何一个引擎得到响应。”??EMC为跨VPLEX引擎和跨VPLEX集群设计了一个共同的Cache,从而“通过这种技术可以实现所有引擎一致性工作”。

此外,VPLEX如果有一个引擎或者一个控制器坏掉了,那这个引擎的负载会均摊到其他活动引擎上,这样总体来讲用户可以维持可预知性能,性能降低也不那么明显。不过,王彦飞也表示,如果在VPLEX Metro,也就是双集群,距离100公里范围内镜像数据的VPLEX Local版本的升级版中,分布在不同数据中心的两台VPLEX集群,如果配置不同,那么性能只能依照配置引擎数较少的那个集群的水平。

四个版本面向的不同场景

首先,对于VPLEX Local来说,主要有三个主要的应用场景,首先是对本地存储虚拟化常用的功能,屏蔽硬件差异性,实现跨异构阵列的数据迁移,可以简化频繁迁移的难度、复杂程度。其次,“通过VPLEX整体的聚合能力可以简化多阵列的管理工作,”比如以前每一个阵列都会有相应阵列的管理工具,现在把所有的卷转移到VPLEX上,只要通过VPLEX一个简单的管理界面,可以操作所有卷的分配和管理工作。

而对于VPLEX Local来说,其还能够通过标准化管理简化异构多平台的阵列管理,提高系统的可用性,实现跨异构阵列的镜像。“比如握有一个非常重要的应用,放在一个阵列里做镜像认为不安全,可以跨两个阵列做一个镜像,提高关键业务可用性。”王彦飞表示。

VPLEX Local的应用模式

王彦飞表示,VPLEX Metro的应用场景同样有三个,第一点自然就是跨站点数据迁移和定位,配合Vmotion可以实现站点阵列和虚拟数据的迁移;第二点是“跨站点共享数据、共享接入性”??生产卷活动时,备份卷一般在同步过程中是不可用的,基于VPLEX数据共享方式可以帮助用户构建一个双活动模式,即应用请求可以来自于两个主机中的任何一个主机,无论哪个主机都可以访问到需要的数据;第三则是跟VPLEX Local一样,可以做跨地区、跨阵列的镜像,但比Local的距离延伸得更远,可用性提高得更多。

VPLEX Metro的应用模式

VPLEX的另外两个版本VPLEX Geo和VPLEX Global由于目前还未发布,王彦飞说只能有一个大致的轮廓,如VPLEX Geo将会比Metro整合的数据中心距离更远??“Metro只能把同城的两个数据中心整合起来,通过Geo可以把异地的数据中心也整合起来。”而Global版本,王彦飞说,“实际上就实现了所谓私有云的基础架构,为你的私有云铺平了道路。”

因为没有正式发布,VPLEX Global的应用场景还是计划中的。

有趣的是,EMC将从物理数据中心过渡到联合数据中心环境分为两步,第一步是从独立的系统,通过FAST系统在单机柜和存储系统中整合;第二步是将数据中心彻底“联营”,达到不同平台、不同架构的联合运行,共同服务私有云架构,EMC方面,将这种做法称之为“Federation”,即联邦,如果从政治学上面理解,或许,能够更清楚的了解EMC对于其私有云未来发展的看法,在政治学上,联邦制被称为“联邦制是由两个或两个以上的政治实体(共和国、州、邦)结合而成的一种国家结构形式。”如今强大的俄罗斯,便是一个联邦制国家的最好代表。