大数据“流言”：Hadoop和云分析七误解

Hadoop和大数据七大误解b

王迪发表于：13年05月09日 11:00 [转载] 中关村在线

分享：

[导读]如今，数据量在以惊人的速度增长，从IDC分析师报告中2013年数据存储上的增长速度将达到53.4%，AT&T更是声称无线数据的流量在过去的5年内增长200倍，从互联网内容、电子邮件、应用通知、社交消息以及每天接收的消息都在显著的增长，这也是众多大企业都聚焦大数据的原因所在。

4.虚拟化会导致性能下降

Hadoop最初的设计只是运行实体服务器上，然而随着云计算发展，许多企业都希望能作为云数据中心提供服务。之所以虚拟化Hadoop，企业首先要考虑管理基础设施的扩展性，认识到扩展计算资源，比如虚拟 Hadoop节点在数据和计算分开时会对性能有所帮助，否则如果你关闭某个Hadoop节点将丢失上面的所有数据或者添加一个没有数据的空节点。

5.Hadoop只可以在数据中心运行

对于在SaaS云服务解决方案，许多云服务允许云端运行Hadoop、SQL，这无疑可以帮助企业省下数据中心建造投资的时间和金钱。特别是对于公有云情况下，Java开发者可以从Spring Data for Hadoop以及一些其它的GitHub用例中获益。

大数据复杂性

6.Hadoop对虚拟化无经济价值

Hadoop被很多人认为，尽管在商用服务器上运行，添加一个虚拟层在带来额外支出的同时并不会有额外的价值收益，但其实这个说法并没有考虑到数据和数据分析事实上都是动态的。虚拟化基础设施同样可以减少物理硬件数量，让CAPEX(资本支出)直接等于商用硬件成本，而通过自动以及高效利用共享基础设施同样可以减少OPEX(运营成本)。

7.Hadoop不能运行在SAN或NAS上

尽管Hadoop在本地磁盘上运行，对于中小型集群一样可以在一个共享的SAN环境下体现良好的性能表现，而高带宽比如10GB以太网、PoE以及iSCSI对性能同样有很好的支持。

由此，大数据成为行业追逐的热点，以上七大有关大数据“误解”问题的客观看待。如同不同项目需求不同，Hadoop是一个工具来帮助企业更好的应对大数据问题。无论是面对数据网格的GemFire ?或SQLFire，还是面向消息的RabbitMQ中间件，一个完整的SaaS解决方案如今比在Hadoop环境更容易实现。

[责任编辑：袁家驹]

SAP HANA应用与需求的那些事

在这个大数据的时代，数据库软件需要应对当前企业里不同来源的海量数据，并将这些不同结构的数据进行整合，进一步实时进行数据挖掘和分析。所以主打ERP软件的SAP公司肯定也会做出应对高性能的大数据分析软件来满足这一巨大的市场需要。

官方微信

相关阅读

精彩专题更多

2014企业级IT风云榜

存储风云榜”是由DOIT传媒主办的年度大型活动。回顾2014年，存储作为IT系统架构中最基础的元素，已经成为了推动信息产业发展的核心动力，存储产业的发展迈向成熟，数据经济的概念顺势而为的提出。

华为OceanStor V3开启全融合数据架构时代

华为OceanStor V3系列存储系统是面向企业级应用的新一代统一存储产品。在功能、性能、效率、可靠性和易用性上都达到业界领先水平，很好的满足了大型数据库OLTP/OLAP、文件共享、云计算等各种应用下的数据存储需求。

联想亮相高交会

联想携ThinkServer+System+七大行业解决方案惊艳第十六届高交会