EMC基辛格:大数据和云计算概念不同但有交集

“EMC正在处于转型期,从过去到未来,这种变化让EMC将是两家完全不同的企业,”EMC信息基础架构产品事业部总裁兼首席运营官帕特•基辛格一年后如约再次来到中国,“过去EMC只是一家存储厂商,而未来EMC将引领信息基础架构解决方案市场的发展,成为市场的领导厂商,而不再是一个跟随者。”

EMC 2011年开局不凡,第一季度财报显示EMC Q1综合收入创纪录达到46亿美元,其中在在欧洲、中东和非洲地区、亚太地区和日本都取得出色业绩。“其中大中华区业务增长态势非常良好,在中国的市场份额在增加中,研发中心的能力也不断壮大,其中包括Hadoop和Greenplum的研发工作也在中国进行。目前对大中华区EMC团队的表现非常满意。中国市场很大,所以要走的步伐还要更快一些。”基辛格如是评价。

在刚刚结束的EMC World 2011上,EMC除了一直倡导的云计算外,还抛出了“大数据”概念,大数据构想是EMC带来的全新理念,想要理解好这个概念首先要从“大”入手,“大”肯定是指大型数据集,一般在10TB规模左右,但在实际应用中,很多用户把多个数据集放在一起,已经形成了PB级的数据量,而且这些数据来自多种数据源,并以实时、迭代的方式来实现。这种大数据趋势应该是顺势而生,在医疗、地理信息、基因分析、电影娱乐行业都会存在大型数据,而EMC通过Avamar、Isilon、Greenplum等产品不是简单把数据进行存储,除此之外还需要对数据进行分析,并且与业务流程联系到一起以进行操作。

在本次的EMC World 2011上,EMC针对常用于数据密集型分布式应用的Apache Hadoop开源软件,宣布了一项有关软件发布、集成和支持的全面战略,为客户提供了最强大、最高效率的方法,充分挖掘大数据的价值。这项战略发布,将进一步巩固EMC的领先地位。EMC今天还推出了世界上第一个定制的、高性能的Hadoop专用数据协同处理设备——Greenplum HD数据计算设备(Data Computing Appliance)。

基辛格透露:“可以说Hadoop战略代表着EMC进军开源领域,同时还宣布了15家EMC Hadoop分销商,更多的新产品和解决方案将在VMware大会上进行发布。”

而在大数据市场,EMC也面临着诸如IBM、微软、甲骨文等实力强劲的竞争对手,其中,IBM在大数据领域对EMC威胁极大,对此,基辛格分析道:“IBM拥有非常丰富的资产,比如有DB2数据库环境,而且IBM收购了很多企业,在整个硬件、软件、解决方案都有非常强的研发力量。最近IBM在推进大数据项目,IBM也是Hadoop的分销商,所以在大数据领域EMC和IBM有很多竞争。但我们的大数据战略不同,EMC秉持着基于云、虚拟化、X86架构,而IBM是局限于大型机架构,不具有伸缩性,这将极大制约IBM架构的发展。”

事实上,大数据和云计算是两个不同的概念,但两者之间有很多交集。简单形容两者的关系就是“大数据离不开云”,支撑大数据以及云计算的底层原则是一样的,即规模化、自动化、资源配置、自愈性,这些都是底层的技术原则,实际上大数据和云计算之间存在很多合力的地方。