DOIT 5月19日原创报道: 帕特•基辛格,现在是EMC一颗冉冉上升的明星高管,在此之前,他就职于英特尔公司,在企业计算领域呼风唤雨,他的一句话便能够影响服务器市场的发展。当下,他在EMC World 2011上的几十页演讲资料,为数据存储行业,带来了大数据的浪潮。
5月18日,在北京再度见到基辛格,他还记得2008年上海IDF的时候我曾采访过他,而我对他说,EMC在数据存储行业的领袖地位,就像是英特尔在处理器市场一样难以撼动,他仍然是一笑,或许是默许,或许是EMC的胃口远不止如此。
在EMC工作的基辛格仍然与英特尔产生着密切的关系,正如他在采访中所说的EMC“是业界唯一一家百分之百采用英特尔技术架构(的数据存储厂商)”,而他在谈到EMC未来五年的发展目标时说,EMC的目标,是最多用五年时间,在数据存储行业把自己的市场份额翻一番,这样的野心他也曾经有过,并最终以远超目标的结果实现。
帕特·基辛格表示,EMC目标是争取更多的市场份额,“至少要翻一倍”。
“我们有两个目标,一个是在市场上不断扩大我们的市场份额,另一个是在市场上成为行业的领袖,我们提出的观点、概念,都是体现在我们要成为业界的最前沿的时髦的领导厂商。”基辛格让奔腾Pro成为今日的至强,在服务器企业计算领域呼风唤雨,占据超过80%,假以时日,基辛格或许希望同样的成绩能够在他就职EMC期间出现。基辛格对成为市场领导者的感觉并不陌生,并且,他应该知道如何重拾这种感觉。
大数据与混合云是帕特•基辛格重拾旧日感觉的重要手段,“Big Data”这个在一年前还从未有人提到过的概念,经由他在EMC World 2011上向全世界宣布,成为甚至是EMC对手的IBM的随追逐的未来发展方向;EMC通过一系列的发布,明确了其希望借助混合云上的优势,占据未来云计算市场高地的战略——大数据与与混合云就是昨日基辛格手中的酷睿与至强,对于他来说,这种感觉应当也是十分熟悉的。
不过,帕特此次访华也在彻底否认了人们有关EMC生产服务器的猜测,他与EMC总裁乔图斯一样,明确否认了EMC这家“Big Data”的前行者进入服务器市场的可能——这是一件已经下了定论的事情——“EMC不会做刀片服务器、基架式服务器,我们要做的是原来存储设备和服务器设备之间的融合。”
释疑:大数据与云计算到底有什么关系?
在刚刚结束的EMC World 2011大会上,大数据的概念被反复提及,成为媒体争相报道的热点,在新闻中大数据常常与混合云、云计算等名词共同被提及,给人以大数据与云计算之间“不可分离”的感觉,让人认为云计算与大数据具有“必然的联系”。
但笔者却认为,大数据只是数据集、非结构化文件等数据量级发展到新阶段的必然,而非与云计算一同出现,甚至被混淆为一个概念,对此,基辛格肯定了笔者的看法,他表示,“事实上大数据和云是两个不同的概念。”在EMC World 2011大会上,大数据之所以与云计算频频被一同提及,是因为“两者之间有很多交集”。
采访现场
“现在业界主要做云的公司有谷歌、雅虎、亚马逊都拥有大量大数据。像MapReduce,也是从这些企业中延伸出的公司。当我们打造云设施的时候,就会想这样的设施上跑什么样的应用,大数据就是在云上跑的、非常典型的应用。”基辛格认为,之所以大数据与云计算在当下密不可分,主要源自于大数据所需要的运行环境,如果做传统的电子邮件应用,用户可以选择在云上跑,也可以不在云的环境下运行,但是大数据应用必须在云设施上跑。这让大数据极为依赖云计算的环境,而云环境并非“非大数据莫属”。
“这就是两者的关系——大数据离不开云,所以我们说两者之间有非常密切的关联。”基辛格表示,之所以EMC将大数据与云计算一同提及,还有另外的一层考虑,那就是支撑大数据与云计算的底层环境是一样,都是具有规模化、自动化、资源配置和自愈性的平台,这些底层技术原则的通用性,让两者更加天然的结合在一起。
对于EMC来说,将云计算与大数据一同考虑发展问题、布局未来,更具成本效益,也“存在很多合力的地方”。
EMC执掌大数据:时代造英雄 还是英雄造时代?
“大数据现在还只是在初级阶段,是我们的构想和未来,如果我们一年前知道这个趋势,一年前我们就谈了,但是我们也是今天才知道。”在基辛格加入EMC之后,这家公司开始更多的展望未来而不是“将产品发布与产品出货硬性的安排到同一天”,EMC开始预览几个月、1年甚至几年之后的趋势与产品路线图,这样显著的变化,也让EMC在2009年首度在数据存储行业提出云计算战略之后,再一次在大数据上占据先机。
但这样的改变也带来了相应的疑问,曾经从未预览过超过6个月出货产品计划的公司,现在提出“仍然处于初级阶段的”大数据概念,到底是EMC在造就大数据的时代,掀起市场的又一轮噱头,还是大数据时代真的已经来临,而EMC恰好成了站在风口浪尖上,即将成为造动时代的英雄?
针对笔者的这个疑问,基辛格在回答中是这样说的:“你说得很对,数据分析的历史已有30年,现在我们已进入大数据时代。”显然,他认为大数据的时代已经到来,无需再“造”,EMC做的,就是要如何顺应时代潮流,并成为弄潮儿脱颖而出。
与英特尔造就了X86时代,成为造就时代的英雄不同,基辛格认为,EMC现在所经历的更像是“时代造英雄”的过程,与X86时代在英特尔推动前从未出现不同,大数据、混合云的时代已经到了,EMC的工作就是,如何在这个时代成为英雄和领袖,正如他所熟悉的。
“谈到大数据的特点,一是数据规模是PB级,二是多数据源,能够把半结构化、非结构化和结构化的数据很好地融合起来。同时具有实时、可迭代的特点。”基辛格用已经存在的Facebook来形容大数据时代的到来,“具体形容就是大数据环境类似于Facebook环境,随时可以添加变量。”
他还用笔者所提到的数据容量常用单位的改变来佐证他的观点:“谈到大数据我们不用PB,要用TB级形容,有的用户数据集以10TB计,而有的客户已达到PB级了,用现有的结构,处理数据量级非常小,而且只能处理单一数据源数据。”基辛格说,大数据对EMC的挑战已经不仅仅局限在存储和保护,数据分析的挑战也日趋紧迫。
“在处理大量级以及多数据源的数据能力非常弱。这也就是为什么我们专门开发出了一些针对大数据的分析工具。”他表示EMC收购Greenplum,支持开源的Hadoop计划的目的即在于此。基辛格很明白,大数据的挑战不仅仅在于存储和保护,数据分析能力的强弱,将成为这个时代的关键点:我们已经解决了数据存储和保护的问题,所需要的只是时间,但是海量数据分析的问题,我们还没有在大数据到来时做好准备。
大数据时代存储变局:从静态资产走向动态价值
磁盘存储系统的容量,随着磁盘容量的增加、磁盘数量的增长而不断增长,即便成本高昂,我们仍然有办法让数据成为静态资产,即便是在PB级的大数据时代,存储系统也能够应付PB级的存储需求,但数据分析系统,却尚未为此做好准备。你为TB级的数据集做好数据分析和智能发现的准备工作了么?
大数据时代正对存储厂商产生深远的影响,数据作为静态资产的存储、保护工作正逐步下降到二线地位,数据的动态价值——数据分析、商业智能、数据挖掘——进入一线,今后伴随的必然是传统存储厂商在大数据时代的数据资产领域的价值下降,如果想继续获得极高的利润和发展空间,EMC就必须寻找让数据从静态资产产生动态价值的方法。
乔图斯的答案是Greenplum和Hadoop,基辛格认为这是大数据时代的必然选择,因为随着越来越多的客户将多个数据集整合形成PB级的数据量,他们需要供应商有能力把数据进行存储、分析和操作,而不仅仅是静态的保存,“把企业流程和数据整合在一起”对所有的客户,尤其是对大数据是有意义的。因此,EMC与Google主导的Hadoop开源社区项目合作,也同SAS合作,目的就是为了补足EMC在数据分析、数据可视化上的弱势。
基辛格说,EMC在这上面并非没有优势,其优势就是硬件系统和软件平台可以为了Hadoop和SAS做改变,而不是让这些软件做太大的改变:“在EMC World中,我们谈到Isilon会用OneFS代替HDFS,实现应用间的共享,有了应用可能,也可以调动Hadoop数据。既可以有企业级的存储,又可以有Hadoop的性能,而不需要重新建立数据环境。”
成为Hadoop分销商,并通过15家合作伙伴分销EMC Hadoop解决方案,基辛格不觉得这是个特别重要的消息,他认为这只是标志着EMC进入开源领域的开始阶段,他笑了笑说
“你们现在也应该让我们保留一些秘密,这样到发布时才可以跟大家进一步分享。”这无非有两方面的考虑,一是确实有些路线图还没到时候公布;二是EMC的Hadoop计划只是配合Greenplum的一个开始,以Greenplum这个“自家的娃”为核心,EMC肯定有更多的发布,尤其是在进入开源社区之后,开源的力量不容小觑。
不做服务器 但要做数据中心老大
不做服务器,并不意味着“EMC的触角不会向数据中心内再延伸出几公里”,Greenplum的收购,Hadoop解决方案的推出,以及新的PCIe/NAND闪存服务器式设备Lightning,EMC的触角在数据中心内越伸越多,越伸越紧。但伸向Greenplum和Hadoop的触角只是其中的一小部分,随着服务器和存储融合趋势的显现,EMC的触角其实已经在伸向服务器领域,只是尚未有“传统概念的服务器”被EMC所宣布出来而已。
“我们想做的是针对移动的工作负载,有的是数据密集型、有的是计算密集型。对于数据密集型的,我们希望存储阵列层面就可以覆盖这部分工作负载。”基辛格表示,现在“存储设备和服务器之间的界线之间也在变得模糊”,服务器越来越像存储,存储系统也越来越多的具有计算、分析能力,尤其是数据密集型应用在逐步与计算密集型应用平起平坐的今天,基辛格确信,存储系统将具有越来越多的服务器特质。
在数据密集型应用框架下,VMAX这样的采用至强处理器,最大8节点的高端产品,何尝又不是一台高性能的“数据服务器”?今年年底前将上市的全闪存版本的VNX和VMAX,其面向数据密集型应用的性能,又何惧任何一套四路、甚至是八路系统?
“EMC所有的阵列、存储都是使用了英特尔的至强处理器产品,我们在做的一件事是什么呢?就是让我们的存储设备更具备服务器的能力,而英特尔是让服务器更具备存储的能力。比如我们展示的存储阵列可以托管虚机,事实上这也是客户的需求。”
基辛格承认,在EMC战略中,更多的参与到基础架构部分是重要的一环,像VBlock这样的解决方案,就是EMC渗透入数据中心、基础架构甚至是企业计算的一部分,他认为,融合给了EMC更多的机会,“用户其实并不关心到底在哪个虚机上运行应用,他们要实现的只是自己的应用。”
他也同意了媒体记者有关数据边界的界限正越来越模糊地的说法,EMC虽然不做服务器,但是要把数据在各个层面上的变化都管理起来,从服务器内部到存储、保护,再到数据的分析、可视化与利用。此外,EMC在做的事情,也包括让EMC的存储设备“更具服务器的能力”。基辛格的话实际上证实了目前业界对服务器和存储系统融合讨论的再度热潮并非空穴来风。
EMC本身的定位与市场形象也在发生着变化,人们开始不把EMC当做一家存储厂商,但EMC是什么样的IT供应商呢?在笔者来看,过去通过服务器、存储、网络、软件来划分厂商的方式已经“失效”,存储服务器、高性能存储系统、数据库机这些设备让服务器、存储的界限变得模糊,各个供应商也都开始在与自己业务有关——甚至是无关——的周边市场进行发展,正逐步变得不那么像以前的自己——但我们仍然会想知道上面这个问题的答案。
基辛格用“过去的EMC和未来的EMC将是两家完全不同的企业。”回答媒体记者的疑问,他表示,“EMC现在确实处于转型期,正在重新定位自己(或许是)。”——“EMC的技术有很多是用于数据中心甚至是面向下一代云以及大数据的蓝图。”——基辛格也承认了EMC的战略开始向数据中心倾斜而非单单为数据服务的变化。他认为,对于EMC来说,2010-2011是一个分界线,在这个界限的两头,“是两家完全不同的公司。”
当然,在转型未告结束的时候,EMC到底是什么公司这样的话题仍然不能盖棺定论,事实上,基辛格也只是更多在表达“EMC在转型,在与过去say goodbye”而非“解释新的EMC到底是什么的问题”,或许这一切的答案只能够等待乔图斯完成他为EMC所设计的蓝图最终画上句号的那一天。
不过,基辛格显然也不想在媒体面前让EMC表现的过于激进,这可能会更加模糊EMC在笔者笔下的定位问题,因此,他重申EMC过去是存储公司,现在EMC仍然是存储企业中的第一名,同时在虚拟化、备份市场也是全球第一,在信息安全市场是全球前三大厂商,也提供很多的管理工具,数据分析其实是“在在诸多领先业务中非常自然地延伸”。
这样的变化不仅出现在EMC身上,老对手IBM同样也在转型,百年IBM的广告甚至已经打到了EMC大中华区楼下的公共汽车车身上,基辛格对于老对手IBM——英特尔与IBM在关键业务处理器上处于竞争位置——的变化,以及与EMC的竞争是这样说的:“EMC秉持着基于云、虚拟化、X86架构,而IBM是局限于大型机架构,不具有伸缩性,这将极大制约IBM架构的发展。”
X86、数据中心、大数据、混合云以及在各个领域都产生竞争的对手IBM,这构成了基辛格在EMC工作的核心,对于他来说,重温旧日的感觉确实阻力重重,不过作为EMC公司总裁兼信息基础架构产品事业部首席运营官,帕特?基辛格看起来更相信EMC通过强大的开发能力在广阔的商用环境中所积累的经验。他的成功,可以复制。