三路出击 VMware云平台抢滩大数据

当云计算遇上大数据,如何在虚拟环境中获取大数据的价值,是企业必须面对的问题。VMware给出了他们的答案:在统一的vSphere云架构之上,提供GemFire实时处理、GreenPlum交互处理及Hadoop批处理三种模式,满足用户的海量、快速及灵活的大数据处理需求,并为开发者、数据分析师、数据科学家和商务用户提供数据分析及可视化的数据展示。

与IBM、EMC、富士通、Intel等先后推出Hadoop发行版不同,Vmware更专注于基础架构层面。在一场2000余人到场的VMware & EMC大数据云高峰论坛上,VMware公司大中华区总裁宋家瑜表示,云的平台才是唯一能解决爆炸性大数据使用的需求,把关键应用移到云平台已经是一个必然趋势。

Vmware之道:从vHadoop到GemFire

在介绍数据管理技术《从数据库到数据云 虚拟化与开源搭桥》五大趋势之后,VMware全球高级副总裁范承工表示,传统数据库技术hold不住一些这样的应用:海量数据的需求,实时数据的需求,和灵活数据的需求。Vmware和EMC一道,致力于在vsphere云平台之上提供面向这些应用的整体解决方案。

Hadoop由于其低成本和高扩展性的优势,成为各大厂商处理海量数据的法宝,但虚拟基础架构云上的Hadoop,存在可靠性问题。根据阿帕奇Virtual Hadoop wiki文档给出的结论,可以将Hadoop带到云基础架构上,但物理和虚拟基础设施之间的差异可能危及数据完整性和安全性。

现在,VMware开源项目Serengeti试图改变这个问题。该项目将允许企业在云端和虚拟环境中,在 vSphere 上部署和管理Hadoop。

范承工介绍,Serengeti将Hadoop在虚拟基础架构的部署时间从很多天缩短到10分钟,同时还能够提高硬件的利用率,能够满足多租户的需求,有更好的安全隔离,也有更好的伸缩性。Vmware还介绍,通过 vSphere,Hadoop应用如果节点失败能够自动重启。