准备好钱引进对象存储了吗?

对象存储很长时间以来一直被人们仅仅认为是用于长期归档存储——在磁带存储或删除之前的数据存储步骤。我们已经看到许多IT单位将对象存储认为是为了迎合政府规制要求而使用的奇怪的东西,而不是可以帮助企业赚钱的竞争性战略资产。

正常地,当公司投资于高端IT资产的时候,比如投资于企业级存储,他们希望能够很大程度上收回这些投资。例如,这些资产可能会提高重要应用程序的性能或有效合并数据中心。也许,他们甚至开始分析大数据来分析更好的业务营运方式。

这种类型的“赚钱”项目主要和文件和块类型存储有关——这种存储是用于支持数据库、主机办公室生产应用程序,并为虚拟化项目构建共享资源的主要常用存储。

这种情况将发生改变。

如果原来你是有意藐视或只是忽视对象存储,那么现在是时候更深入了解对象存储的时候了。如今的对象存储为生产效率的提升、全局平台的创建以及新收入流的开发提供了良好的功能。

对象存储已经从原来的二级数据倾倒平台发展为针对内容和协作的价值构建型主存储平台。最新的高性能云存储解决方案可以转变整个企业级数据存储的性质。为了真正探索这种新一代对象存储,我们不仅需要了解对象存储是什么以及它是如何发展的,而且还要开始思索如何在构建新业务上利用好它的新兴功能。

归档对象

对象存储的设计是提取一定的数据单元——一个文件、一个图片、一个加密传感器数据流——并有效地将它存储为磁盘上的单个对象。

和文件系统不同,对象存储没有浏览树或目录来维护。当被存储的时候,每个对象都获得独一无二的ID(识别码),而这个ID通常是来自一个庞大的“扁平”(通常是128位)地址空间。这意味着理论上可以存储大量的对象,避免文件系统的限制和开销。

对象存储同时还保存着每个对象的元数据。在归档情境下,元数据用于方便和启用生命周期数据管理(比如,“在三个月后压缩这个对象,在三年后删除这个对象”)。

第一个被广泛使用的对象存储类型,成为内容可寻址存储(CAS),它可以在数据被保存的时候通过应用一个哈希函数来创建对象ID。如果得出的ID已经存在于系统上,那么该数据就是已经被保存了,系统会进行内置的对象层级重复数据删除。当CAS对象被访问的时候,哈希函数会再次启动以检查ID,证明该对象是被请求的对象且同时该对象没有被修改。

CAS系统,比如EMC的Centera和戴尔的DX(基于Caringo CAStor),用于归档合规情景是很理想的。

将归档转换为内容

传统的CAS类型对象存储很大程度上是被用户用于防御性目的的。对象存储是归档静态数据的好方式,可以确保符合合规要求。这是因为它可以方便地用于在可存储数百万个对象的可扩展架构上实施任意访问、保留和删除政策。

如果,如果对象存储所能提供的只是更好的归档,那对用户单位提高收入流也没有什么帮助,更不用说创造新的收入来源了。

我们认为IT应该尽其所能来帮助提高企业生产效率。对象存储可以被用为一种转换性服务来为用户提供更多的价值。

由于对象存储可以在接近于线性性能增长的模式下支持大型归档在线回收,被动式归档流程可以支持新的主动使用情景,从而利用好更多的历史数据。比如,考虑一个像RainStor这样的部署在CAS对象存储上的解决方案。它可以归档生产数据库的旧数据,同时将在线SQL查询访问维持到被归档的记录上。因此,它提高了生产数据库的性能,同时还可以从历史数据中挖掘更多的价值。这是基于对象的归档如何为企业贡献价值的一个好例子。

云协作

随着云存储和协作解决方案的日渐流行,现在我们有更大的机会来积极地使用对象存储。对象存储已经成为一个很好的平台(无论是内部使用还是通过IaaS——基础设施即服务)来提供公司员工所要求的私有Dropbox。它可以改善协作,同时提供了一个确定的方式让IT可以明确地提高生产效率。

为云构建而设计的对象存储整合了先进的地理分布对象功能,可以确保多租赁能力,并且承载web友好型API(应用程序编程接口)。云大小的可扩展性和全局内容分布是云对象存储产品的招牌能力,就好像EMC的Atmos和Amazon Web Services S3。基于云的共享和协作解决方案是很适合承载在云对象存储上的——Dropox本身就是构建在S3上面。

云对象存储的优点之一是它支持编程人员友好型API。Web和移动应用程序开发人员可以简单地“发表”和“获取”HTTP上(通过基于REST的API URL,可以将数据对象看做是网络资源)在云共享存储上的任意数据。他们不需要写入本地磁盘或交叉载入文件系统——这种方式可能不可靠而且对数据访问来说也不方便。

云对象存储也发展了数据保护功能。除了RAID(独立磁盘冗余阵列)和全复制外,它可以实施空间高效型擦除码算法,可以在更多故障下载更长时间内保护数据。擦除码可以在写入新对象的时候实现指定水平的数据冗余度。编码后的对象由多个部分组成——只有一部分需要读取原始数据。这些部分被有效地分布在云上以提高安全性和弹性。

高性能对象存储

对于web服务器上的全局访问性和互联网速度的应用程序开发来说,毫秒级以下的文件或图片共享不是问题,云对象存储越来越成为平台选择。不过,传统对象存储解决方案要慢于许多需要实时或接近实时的数据分析、数据库处理和流数据提供的重要的商业应用程序。

由于早期的对象存储解决方案是作为归档的二级存储用的,许多解决方案被设计成隐藏文件系统和更深存储架构堆栈之上的额外的软件层,自动产生内部性能开销。比如,OpenStack的开源Swift对象库是设计为可以在其他存储(包括其他对象存储解决方案)之上加入层以提供它的目录服务。

不过现在有一些新的“性能”对象存储架构从头开始设计以直接管理所有直接到磁盘的IO(输入输出)。这种对象存储可以提供和块IO媲美的高性能,同时提供所有上述的其他对象存储功能。

比如,DDN的Web Object Scaler(WOS)可以提供超级计算机类型的性能,同时提供云对象存储架构的可扩展性、全局访问、增强的数据保护和空间效率。

对象存储步入中央舞台

我们预计在明年内许多系统架构将需要和期待对象存储来作为开发新应用程序(尤其是web和移动应用程序)的平台。许多IT单位都将部署私有云存储和协作项目来防止他们的用户使用替代的公共共享方案。这些趋势都将使对象存储从归档的阴影下走入阳光中,直接地带来正面的商业价值。

随着高性能功能的发展,对象存储正在成长为主存储。高性能对象存储可以用于那些可以显著影响收入机遇的使用情境。

我们最近遇到的一家公司就在使用高性能对象存储来为大量的地理上不同分布的用户提供新的视屏流应用程序。他们原来无法在文件或块存储系统上经济地部署或操作这些代表新收入流的视频应用程序。

高性能存储还可以支持涉及大型数据对象的全局协作解决方案——比如,支持大型分析数据集、医疗图片或媒体的全球共享。我们还看到高性能对象存储还可能适合作为记忆体内分析数据库大型实施的持久层,比如SAP的HANA。

对象存储已经从原来的归档用途发展到可以媲美文件和块存储,尤其是在为新的业务机遇提供架构的时候。新一代对象存储不仅可以保存大数据,而且可以支持新型全球大数据工作流。文件和块存储最好应警惕对象存储的趋势,因为从我们的角度看,高性能和高容量对象存储明显是奔向主存储的目标而去的。