独家披露EMC研究计划:全球化的Maui

对于Maui来说,人们在一年前的反应与现在完全不同,那时候大家都充满着信心,EMC的首席行政官乔图斯当时在EMC大会上告诉分析师们一系列EMC将会发布的产品代号,其中,Hulk和Maui这两款硬件和软件的结合产品引发了人们的强烈兴趣,因为人们被告知这将是一种全新的集群存储系统,能够将全域的资料库扩展到几个PB的大小,并且说六个月后将能够看到这些产品向公众发布。

但是时间过去一年,Hulk作为一款硬件成为了Infiniflex 10000,这是一款缺乏真正的软件平台并且极少进行营销推动的演示产品,换句话说,EMC并不是那么重视Hulk了。(编者注:有关Hul的新闻国内几乎没有报道,DoSTOR特地为您找到一篇介绍Hulk的今生,也就是Infiniflex 10000的资料,请见:独家披露EMC研究计划:Hulk详细配置

看起来Maui已近从EMC的词典里面消失了,此前有EMC的内部员工在Blog上通过视频披露了一些Maui的细节,但是此后,这些内容却被突然的删除掉了。

这并不是说有关Hulk和Maui的计划失败了,只是EMC仅仅确定了初步的计划,而没有让我们看到然后的内容。比如EMC技术部门的副总裁Chuck Hollis等人,将不会再谈论Maui,而是转而谈论全域存储库上所需要的软件。

EMC所设想的仍然是令人兴奋的,但是现在Maui的状态可能显示出其开发上的困难,他似乎不仅是存储阵列控制器软件,而是提供了一种全新存储基础设施的软件。这样针对网络前端和数据管理的存取和存储可以同全球数据存储中心相互链接。

以下是Hollis和其他EMC的人在过去一年间所说所写的一些解释。

基础设施系统和集群对象/档案

Maui被EMC描述为一个能够在遍布全球的范围内管理数据存储的存储设备,他能够保护、迁移数据以提供本地化的数据访问,而无论用户身在何处。(编者注:这听起来是不是很耳熟?对了,它很像是云计算的概念。)

我们被告知,Maui不仅仅是一个集群文件系统,规模要大于任何目前已知的应用。它建立在建立在通用系统元件之上(编者注:从Hulk的情况来看,其确实采用了通用处理器,而不是我们常见专用存储控制器),并包含在一个基于通用硬盘驱动器的集群存储阵列之内。这些存储单元以对象为单位,在Hollis看来,这既不是文件级系统的做法,也不是块级系统的做法,因为它是基于对象的并且能把规模扩充到足够大。

于是,我认为应当可以谈论几十亿甚至数万亿对象及其相关数据,多达几个PB的存储容量和数以百万计的用户。对于这个系统,成本一直倍受人们的关注,因为有这么多的组件,比如说成千上万的硬盘驱动器,不过仅仅是百分之一的节约或是提高利用率都能够节省下来数百万美元。

事实上,我们在这里谈论的是从无到有建立一个Google级别的基础设施,但是,Google并非一簇而就的,Google创始人Sergey Brin用很多年的时间才建立起了我们现在看到的搜索巨头——这就好比英国建立国民健康IT系统,但不过是在全球范围内将这个IT系统的每一个方面,无论是性能还是存储容量和网络连通性都乘以100万倍,Hollis需要利用其强大的肌肉来完成这一切。据外界猜测,Hollis针对这个项目已经建立了一个独立的公司。

Maui系统的数据访问性能几乎可以是万能的,它可以连接几乎所有能够连接到互联网的用户端设备,无论是智能手机、笔记本电脑、台式机还是服务器,甚至还有机顶盒、移动iTunes设备(如iPhone和iPod)、RFID应用等发送数据的传感设备、VOIP电话、监控摄像机和卫星——这个范围几乎覆盖了所有能够想到的数据设备,这完全能够让你的想象力发生混乱。

这些网络基础设施的运行几乎全部都是运营商级的,用户的应用简单的像使用手机或是用电。

尽管一些接入设备不使用Maui软件,不过它们访问对象或文件,抑或是申请获得的数据,都会储存在Maui的基础设施上。

他们怎么知道它是储存在Maui基础设施上的?这些设备如何知道Maui存放的内容?每个节点如何让其它节点得知内含的Maui内容呢?对象输入和删除处理,指标更新,其空间配置/填补是如何进行的?对象安全级别的创建,维护和改变又是怎样的?

下一页:Maui到底是什么?

Maui到底有些什么?

下面将告诉你们Maui到底有些什么??它将是一个集群存储节点,一个文件或是对象存储系统,从字面上看,还会是一个全域命名空间的系统,一个对象存储和分级系统。Maui将是一个对象级的存储、管理、位置可知并且保护数据的系统,能够处理搜索任务,并且还具有实施的数据迁移能力,记住,是在全球的距离范围内。这将是一个全球性的知识库内容管理系统,支持多节点客户端的读取、访问要求,并提供完备的支持。它是自我调整、自我修复并自我纠正的管理系统,能够对需求的激增做出反应,并免受任何的单点故障。

Maui将是一个对象级的访问和跟踪系统,能够自动的将内容交付给读取热点并进行负载均衡,而这将在全球范围内的集群和数据中心节点中的存储节点中进行。与此同时,这将是世界上最复杂的业务连续性和灾难恢复系统,运行在一个全球性的数据中心基础设施上面,包括物理和虚拟的数据中心、服务器、网络和存储,在建成之前将十分的复杂,这将需要多种级别的虚拟化并提供多层次的系统配置,满足用户在灵活配置和扩展方面的需求。

说句玩笑话,如果EMC将Maui系统通过外包交付给Google来进行的话,它或许能够加快建立的速度。

Maui是基础设施或是集群(对象级)文件操作系统?不,它是一个随时随地可以交付的集群对象/文件系统。全球性的并且是自我诊断/管理/调整/容错对象的知识库基础设施,事实是,它非常大,真的非常大。

如果Maui果然如我们猜测的是一个集群对象(文件)O/S,那么他就需要一个基础设施以完成全球的工作。但是Maui的建设和基础设施的建设的分界线在哪里?想要做的越多的Maui也因此时间被拖得越来越长以让EMC真的将它付诸实现。在还没有Maui的时候,我们仍将等待,并建设基础设施。

这很可能在EMC方面被划归成两个项目,一个是Maui,全球性的集群存储软件,还有一个在其背后的就是现在我们一直在用的数据中心基础设施建设(编者注:这并不冲突,Maui将是一个通用化极强的集群系统,拥有我们上述看到的所有好处,但是他毕竟要有底层建筑,Hulk被认为是这个底层建筑的原型。)

然后,Maui在被谈及的12个月之后仍然还没有出现。如果他依赖于基础设施组件但是它却还没有准备好,这个怎么办?看起来EMC不会在所有事情都解决之前就贸然的将Maui公之于众。在这个事情上??Maui加上基础设施??或许是我们这个星球上最复杂的编码项目。我们应该静静地看着EMC的全球开发人员(编者注:从目前的接触来看,尚未从任何EMC中国研发中心的工程师那里了解到他们的参与情况。)尝试着做一件巨蟒吞下驼鹿,甚至是整个鹿群的事情。

对于集群对象/文件操作系统来说,可能发生的事情还有很多,这只是整个事情先期的一部分而已。在一开始交付市场时将会是一个可以直接用于用户现有系统的集群存储系统,当然,日后将会用于EMC的,因为它已经建立了一个自己的全球资料库及其基础设施。

走在发展之路上的Maui可能将会是扩展能力最恐怖的集群对象/文件操作系统,超过惠普的ExDS9100、Isilon,并且一脚将IBM的Scale Out File System(SOFS)文件系统。

但是,如果只是这样,而没有全球资料库及其基础设施,那么EMC将低于自己的预期是可以肯定的,没有基础设施的Maui将成为另一个InVista(EMC的基于SAN导向器的存储虚拟化和管理软件,可虚拟化异构网络存储。)一个有价值但是却难以交付的系统。