硬件巨头们缘何热衷于Hadoop发行版?

EMC已经有了自己的Hadoop发行版,现在英特尔也加入进来。为什么EMC和英特尔等主要的硬件厂商都越来越多地加入到这个软件的游戏中来?能够驾驭大数据的路径之一,就是玩Hadoop。

让我们来看看最近的一些新闻事件:

– EMC发布Pivotal HD Hadoop发行版,将EMC的Greenplum和自身存储技术以及Apache Hadoop结合起来

– 英特尔发布Intel Distribution for Apache Hadoop,这是名字听上去不太时髦,但是原因很明显。英特尔希望从芯片层面搭建Hadoop,提升计算速度和安全性。现在至强处理器支持Hadoop Distributed File System,英特尔宣称,它的处理器时间从原来的4个小时缩短到7分钟。

硬件巨头们缘何热衷于Hadoop发行版?

除了为Hadoop发行版做出贡献之外,EMC和英特尔也在为各自的将来积极筹备着:

– 硬件厂商将Hadoop视为驱动计算的下一件大事

– 大数据的计算需求将导致对硬件的需求增加——服务器、存储和网络

– 针对EMC存储和英特尔处理器进行优化的Hadoop有很大意义

– 随着软件逐渐主导数据中心,硬件最终愈加惨淡

硬件巨头们缘何热衷于Hadoop发行版?

大数据风景的背后是什么?

1、Oracle也许需要它自己的Hadoop发行版,将大数据与数据库连接起来。现在,Oracle是Cloudera的合作伙伴,不排除收购Cloudera的可能。

2、Teradata和其他数据仓库厂商都有Hadoop连接器。这些厂商也许需要他们自己的发行版,但也可能要面对随之而来的各种麻烦。

3、Informatica依赖于数据集成。如果在硬件层上集成大数据,那么就会减少很多工作量。

IT采购者面临的难题是显而易见的:你究竟选择什么样的Hadoop发行版?英特尔有一群合作伙伴。IBM有自己的发行版。还有Cloudera和 Hortonworks也有不少动作。就目前而言,可能最好的做法就是坐下来,评估一下所有这些选择。你的基础设施以及你的决心,可能是一个控制因素。