本周一,开放软件赢得了大量的技术信誉,因为Cloudera公司推出了首个Hadoop商业版本,一个能够存储千兆位容量信息的服务器产品。
Hadoop已经是一个成功的产品,应用于Google,Yahoo, Facebook等公司。“发布该产品的商业版本,几乎是理所当然的事情”,公司发言人如是说。
“在Facebook, Google和Yahoo等公司使用大型Hadoop开发工具之后,我们开始认识到人们希望Hadoop的安装、配置和管理更容易。”Cloudera的创建者和前Google Hadoop群集管理员Christophe Bisciglia说,“我们使所有人都能更容易地存储和处理大量数据,这些数据与大公司在他们的生意中所使用的数据类型相同”。
为了使Hadoop的Cloudera Distribution更容易安装和使用,Cloudera今天还推出了一个新的门户网站,叫做my.cloudera.com。在这个网站里,开发人员和用户可以用基于网络的配置工具创建软件包,并使它更符合他们特定的应用需求,个人设置的群集能够被保存在网站中以便自动更新。
Hadoop分布式文件系统具有容错能力,建立在假设硬件错误频繁发生的基础上,并且具有快速检测能力。该产品的MapReduce功能将应用程序划分为小部分的工作,更好地实现在大型群集自动并性和执行能力。Hive是一个数据存储架构,建立在Hadoop的顶层,为用户和开发人员提供了分析、数据统计和查询的工具。Last is Pig,Hadoop中一个分析大量数据的平台,用高级语言表达数据分析程序。
Hadoop是用Java编写的,因此可以在所有支持Java的平台上运行。虽然如此,大约90%的公司将其应用在带64位硬件的Linux环境中。
Cloudera的Hadoop是免费的,并将分配在Apache 2软件许可下。该产品将作为预打包RPM绑定在红帽Linux系统或Amazon EC2图像上,公司发言人如是说。