2012年六大热门存储技术大阅兵

如何定义存储技术是否是“热点技术”?在我们的定义中,任何可以使得你企业数据存储更加快速、优化或高效的方式都应被贴上“热点”的标签,不过在此之前,这种技术还应当能够针对诸多挑剔的问题提供一种全新的解决方案。从本质上讲,这种技术应当能够回答这种很常见的问题,“人们都可以被送上月球,为什么就不能……?”

在本文中所提到的这六种技术可以极快速地轻松处理大数据存储,将磁带和服务器内置磁盘等已有资产整合至云端,构建企业级的数据中心。

和以往一样,我们这些热点技术混合了前沿技术又不失实用性。基于对象的存储和以往的存储完全不同,其通过一种简单地平面文件方式来管理数据,可以取代以往的文件系统。线性磁带文件系统(LTFS)则是另一种方式,在磁带上增加文件系统,使得磁带变成磁盘。这两种技术同时出现在存储市场上,应对目前海量存储所带来的压力。

多层单元闪存,这种快速发展的技术出现将以往廉价的固态存储可以应用到企业级关键应用中,从而在价格和性能之间达成某种平衡。不过虽然闪存打开了这片市场,基于主机的存储作为后继者,采用直连存储这种创新方式亦进入了市场。

在去年,我们预测云存储服务会出现,不过在今年我们在此预期上提到两种技术将促使基于云的存储资源从本质上称为一个存储层,从而使云存储更易于整合到按需分配的系统之中。

云网关设备

云网关设备作为企业因如云存储的最佳方式,正在受到越来越多的关注。这种设备易于安装部署,价格相对低廉,并且用户可以从最小的规模开始,简易地扩展。

云网关的部署非常简单:该设备安装在数据中心内,在用户现场存储系统和云存储服务之间构筑一座桥梁。这一桥梁确有必要,因为公共云存储供应商通过因特网协议,诸如HTTP上的RESTful应用程序接口,而非传统的存储区域网络(SAN)或NAS协议。通过使用网关连接现场存储和云,云存储服务可以和已有的系统进行无缝的整合。

虽然云网关的实际应用比率仍相对较低,近两年来已有大量产品发布并且广受关注,其很有可能在未来逐步占有市场,因此也列为我们的热点技术。

“用户对将数据迁移至云端颇有兴趣,不过我并不认为企业在应用运供应商提供的API时忍受如何可能存在的风险,”Forrester调研公司的Reichman说道。在云存储市场中,人们需要改善本地性能,降低额外的延迟并且增加应用安全性。

“而这些正是云网关的一些关键特性,这将在很大程度上促使企业应用云存储,”他说。

云网关可以和其它产品整合或集成,并且一些供应商已经和备份、存储虚拟化厂商建立了合作伙伴关系;举例来讲,TwinStrata是Veeam和DataCore的合作伙伴,而StorSimple现在和微软协作,问题在于许多用户并不了解云网关以及其可能带来的好处。

“我想随着用户越来越多地应用云存储技术,云网关最终会受到认可。我发现该技术被更多地集成整合并应用于云存储设备,” ESG的资深分析师Terri McClure如是说。

一些行业内的专家期望在该理念成熟后,数据存储供应商会将该功能内置在其阵列产品中。对于现场存储系统而言,这样可以无须任何中间步骤,可以更简易地将云存储服务视为额外一层存储层。

“我认为唯一还没有定论的是这应当是一家单独的供应商所提供的一款独立的产品,抑或只是其它产品的一项功能,”Forrester调查公司的Reichman说道。

造成网关产品接受缓慢的另一个因素在于提供产品的供应商仍处于起步阶段。

“在被购买者实际认可之前,这些小型供应商还需要进行一定的市场教育,以及建立一些有效的合作伙伴关系。”Reichman指出。

Taylor Higley是美国政府雇员联合会(AFGE)信息服务部的总监,其最近部署了TwinStrata的CloudArray云网关。当被问及为何选择TwinStrata的网关产品时,他的回答只有两个字,“简单”。

“实际上,它可以利用起廉价的亚马逊的S3存储,同时兼顾Veeam 备份和复制系统的安全性和可靠性,”他说,“TwinStrata兼顾了所有这些功能。”

基于对象的存储

网络附加存储(NAS)并非处理文件存储的唯一途径,甚至很多时候并非是最佳途径。

基于对象的存储系统正在逐步受到更多的关注,并开始取代横向扩展的NAS系统。基于对象的存储可以无限扩展,并且不需要很多处理和高速网络的支持,是公有和私有存储云的理想基本构建模块。

但其绝非完美的。对象存储普遍地无法提供高性能并缺乏文件系统的标准,这使得用户很难从某家对象存储系统迁移到另一家。对象存储同样不适合频繁变动的数据,并且较传统数据存储消耗更多的存储空间。不过该技术使得大量数据块的归档更为便宜,较高性能的NAS系统消耗更少的电耗,也节省更多的占地空间。

对象存储使用唯一识别符来存取数据,而非物理地址。数据根据名称和唯一识别符进行存取,这意味着存储系统要读取数据标签和对象ID。这在一个单独的全局命名空间、缓存一致性或高速网络中是不必要的。

诸多传统供应商和新兴企业都在销售对象存储产品。传统厂商的产品包括EMC的Atmos、DataDirect的Networks Web Object Scaler(WOS)、Dell的DX Object Storage、NetApp的StorageGrid和Rackspace的OpenStack;而新兴企业的产品有Amplidata的 AmpliStor、Basho的Riak、Caringo的CAStor、Cleversafe的Slicestor、Mezeo的Cloud Storage和Scality的Ring。

“对象存储可以提供一个不共享的体系架构,其中每个节点和控制器无须获悉每块数据的实际位置,”来自剑桥Forrester研究所的首席分析师 Andrew Reichman说,“你可以进行更大范围的扩展,从而降低成本。正如我们经常谈到的PB级的数据存储,就涉及到这样的扩展性。”

对象存储的特性——尤其是其扩展性,存储位置无关性和可通过HTTP进行访问——使得它非常适合于存储云。标签数据使得管理员可以定义策略,做到内置的多租户、加密和服务回退机制。亚马逊的Simple Storage Service (S3),微软的Azure以及Nirvanix的Cloud Storage采用的就是这样基于对象存储的云存储。

对象存储的其它用途还包括归档(尤其是对医疗影像的归档)和高达PB级别的文件存储。

瑞士的école Polytechnique Fédérale de Lausanne (EPFL)采用Amplidata将来自Montreux Jazz Festival,1967年开始的超过5千小时的影像进行数字化归档。该项目自两年前开始,EPFL运营总监,Alexandre Delidais表示他无法在这种价位找到可以满足这种需求的磁盘存储系统。EPFL采购LTO磁带来继续其研究工作。

Delidais说到他过去一直在找一种存储,可以扩展到PB级别、能耗较少、能够较磁带更快速地回存,并且满足其预算要求。

“没有能真正满足这些要求的,”他说,“我们无法通过磁盘系统找到解决方案:磁盘价格过于昂贵,抑或是占用过多的能耗。”

Delidais在2010年找到了Amplidata AmpliStor。EPFL初期采购了1PB的存储容量,并将其分布在两地进行复制。Delidais表示通过这一数字化项目,他基本上完成了20%的存储。

当然,还未有大量PB级别的数据部署,因此对象存储毕竟不是主流。

“并不是许多采购者实际上要使用数百PB的存储,”Forrester研究公司的Reichman说,“不过我认为从长期角度上是看好对象存储的。这是文件存储的更佳方式。”

云备份

云备份长期以来被认为是一项消费类的服务,而且十分重要的是——在远程站点保存备份数据可以实现更完善的灾难恢复。不过在企业内部有系列阻力妨碍云备份的普及。其中很重要的一点就是这种方式需要一个全新的备份方式以及一个基于云定制的备份应用。不过这一切正在改变,诸多主要备份软件供应商现在都允许用户直接备份到云端。

CommVault系统公司的Simpana让用户可以备份到任意支持REST协议的云供应商,比如亚马逊、微软的Azure,Nirvanix或 Rackspace。Symantec公司的Backup Exec可以提供备份到Symantec云的功能,而其NetBackup中有选项可以备份到Nirvanix。EMC的Networker可以将备份数据迁移到EMC基于Atmos的云存储服务中。

“这些厂商正在将这整套数据保护方式推向那些自身没有第二个备份场地的用户,”ESG的资深分析师Lauren Whitehouse说。

在传统备份产品中集成云使得用户可以创建在线磁盘备份的快速恢复,而无需通过磁带拷贝离线数据。用户现在可以简便地应用云作为灾难恢复实施的一种方式。当有大量数据必须从云端恢复时,许多服务可以将设备或磁盘上的数据迁移回用户现场。而另一些用户可能将其用作归档层,将陈旧的数据备份到云端作为长期的数据保存。

一些数据存储管理员或许仍倾向于过时的备份技术,因为迁移备份产品可不是项简单的工作。并且可能由于使用云备份会需要额外的工具和相应的管理工作,管理员对这一新数据保护技术也会有所抵触。不过当云存储和企业现有的备份应用变得更为紧密时,这些顾虑很快就消失了。

此外,在已有的备份工具上新增支持云的选项,对于一些企业而言,也是应用云备份的一股推力。另外的备份技术——持续数据保护(CDP)——也实现了类似的效果。作为一种单独销售的功能,CDP的应用量非常之小,不过当集成到用户业已非常之熟悉的备份软件产品后,CDP就变成了主流技术。

“备份和长期租赁的应用案例佐证了IT企业可以很好地融入到云技术之中,”Whitehouse说,“这将取代以往需要备份至磁带,并将磁带转运到离线站点的操作。”

虚拟存储设备

随着数据中心服务器虚拟化工作的深入,基于服务器共享的存储市场,尤其是虚拟存储设备(VSA)的市场变得日益庞大。这类软件系统产品在实现服务器虚拟化的高级功能的同时无需专用的,昂贵的存储硬件。其在虚拟机内部运行,从加载虚拟机的服务器的直连存储上创建共享存储。在2012年,我们期待可以看到更多的公司——尤其是那些中小型企业(SMB)——采用基于服务器的存储,作为支持服务器虚拟化的廉价部署方案。

虚拟化存储设备——诸如HP的StorageWorks P4000 VSA软件和DataCore的SANsymphony——已经上市数年,不过VMware公司近期展出的vSphere Storage Appliance则在该技术领域引来更多关注。vSphere Storage Appliance尤其关注于中小型企业,可以跨多个Hypervisor运行,将直连存储资源汇聚成存储池。

“我们发现基础架构虚拟化领域正发生着惊人的变化,有诸多像VMware这样的公司,”Jeff Boles是霍普金顿Taneja集团的资深分析师和验证服务部门总监,他提到,“支持VMware的虚拟化存储设备技术,只是各Hypervisor厂商诸多创新技术中较为突出的一种,不过各大存储供应商应该很清楚理解其中所包含的意义。”

另有一些人认为VMware正利用其在虚拟化领域的技术扩展其技术覆盖范围,这其中涉及到了和更多其他厂商的直接竞争。“我认为VMware将存储视为用户扩展服务器虚拟化能力的一块短板,而且在一定程度上,VMware已经决定要以一己之力改变着一切,”Storage Switzerland的创立者和首席分析师George Crump说道。

虚拟化存储设备对于中小型企业意义非凡,因为其基于iSCSI技术而非光纤通道技术。

“你可能很难找到传统的企业部署VSA,”Taneja集团的Boles说,“如果用户是传统型企业,他们可能会做些私有云或公有云的部署,在这些地方你或许会看到虚拟存储设备。”

虚拟存储设备市场上较为出名的供应商有DataCore,其软件产品为SANsymphony-V,可以在异构系统中虚拟化存储池,将服务器群融入SAN之中。

开曼群岛,格拉斯哥的Barren County School在服务器整合后采用了SANsymphony-V。其IT部门将原有的30台物理服务器整合到4台上,运行30个VMware虚拟机。DataCore软件将两台Dell的服务器来取代EMC的SAN存储。

“缓存可以提供一些更高级的特性,我们采用SANsymphony的原因就是其硬件无关性,而EMC的系统并不支持这样的处理方式,” Barren County Technology Office 的行政技术服务专家Cary Goode提到。

Barren的IT部门利用DataCore的高可用性镜像功能,可以提供10TB冗余的可用存储空间。“我们可以使用整个空间,其他节点会动态保存完全相同的数据,”Goode解释道,“如果采用硬件系统的话,我很难想象这会是怎样的价格区间。”

MLC闪存存储

目前很多迹象表明MLC NAND闪存将会在明年继续其上升势头,并在企业级系统市场上正式取代成本更高的单层单元存储(SLC)闪存,从而宣告一个价格平易近人的固态存储时代的开始。

生产商正逐步扩大其MLC固态存储驱动器(SSD)的产量,而那样以往曾不太看好SSD的存储供应商也加入了这一产品阵营,比如IBM和HP。

IDC公司的Framingham预测MLC驱动器将会占据52%企业级固态存储市场收入,并在2013年达到60%。

Jeff Janukowicz是IDC固态存储市场的调研总监,其表示由于出众的架构,算法和控制器,MLC SSD已经能够处理传统IT所需的读写混合的处理要求。

在线交易商eBay公司在今年转变了IT建设方向,所部署的100TB Nimbus Data系统公司S类固态存储正是业内领先的企业级MLC(eMLC)闪存。

各不同类型闪存之间的主要差别在于产品的可用时间。人们普遍认为SLC可使用大约100,000次读写,eMLC约为30,000,而MLC仅为10,000或更少。不过随着MLC驱动和第三方控制器厂商的工艺改善,这其中差别的重要性正在逐步变小。

“这些控制器供应商发现,通过监测闪存的实际工作状态,可以跟踪每个单独数据块的性能情况,从而使得某些数据块突破10,000次的使用极限,达到数100,000次的使用寿命,”Jim Handy说道,他是位于加利福尼亚州Object Analysis公司的创始人和首席分析师。

根据Handy的观点,即便eMLC和MLC擦除和写入次数的差别正在逐步变小,eMLC并未有像业内期望中的那样流行起来。

“eMLC较MLC而言,成本更高,并且速度更慢,”他说道,“由于每个采购固态磁盘的用户都是冲着性能去的,这种降低速度的解决方案很难销售。”

Dan Mulkiewicz是位于加利福尼亚州High Moon工作室的IT总监,该工作室隶属于暴雪公司,其生产非常流行的电子游戏,诸如“魔兽世界”和“吉他英雄”。他表示即便是最为廉价的MLC固态存储也能带来惊人的性能改善。

High Moon在大约3年前在工作站中使用了10块MLC的固态存储驱动器,发现应用上线时间从原来的30至40分钟降低至4分钟,而后很快增加到了60到70块固态存储。

“我必须使用经济的解决方案,我们的冒险最终被证明是颇有成效的,”Mulkiewicz表示他从未考虑过去采用SLC闪存。

他说工作站中MLC驱动器的故障率小于5%,并且相比普通的硬盘驱动器,供应商的保修期已经从1年提升到了3年。

因此Mulkiewicz从GirdIron系统公司那里使用MLC闪存时一点也没有不安,相反,这很好地解决了其VMware服务器群的I/O瓶 颈问题。Mulkiewicz对这种惊人的性能改善赞叹不已。在最糟糕的情况下,程序员和设计师提交变更后要等上70分钟进行重编译;而是用MLC的闪存 后,只需10分钟就可完成。

“我们现在不仅是对其表示满意,”Mulkiewicz说,“实际上我们完全依赖这种技术。”

线性磁带文件系统(LTFS)

线性磁带文件系统(LTFS)被公认为是一项会让磁带应用复苏的技术。通过文件树形目录,这种技术首次让用户可以搜索磁带上的信息,搜索磁带的流程和磁盘存储一样。用户可以从一盘LTFS格式的磁带上自由拖放文件,这使得业务流程中整合磁带应用以及简易的长期归档成为可能。

LTO5磁带格式首次支持LTFS,其支持磁带媒介分区,驱动器可以对每盘磁带写入两个可变长度的分区。一个分区中包含独立的分层文件系统目录,而另一个存放内容。LTFS为管理磁带上的文件提供了一个文件结构类型接口。用户所需做的就是加载磁带到驱动器,数据就可以通过浏览器或磁带相关应用进行访问。

HP和IBM是两家主要的LTFS软件开发商,而LTFS开放式标准为整个LTO联合会所支持。HP在其StoreOpen Automation上支持LTFS,而IBM则在今年5月在其IBM System Storage LTFS Library Edition中发布支持LTFS的磁带库。其他公司也同样发布了支持LTFS的产品,比如Crossroads发布的StrongBox设备;Cache-A在其旗舰产品Pro-Cache5、Power-Cache和Prime-Cache5支持LTFS功能。此外,Atempo现在使用 Atempo Digital Archive,一种文件归档产品,全面兼容LTFS平台。

LTFS市场仍处于早期阶段,媒体和娱乐行业是其主要市场。Robert Smith是2PopDigital.com的创始人,这家公司为媒体和娱乐行业的后期制作提供编辑系统支持,其表示随着更多的归档管理软件支持这一开放式标准,LTFS将逐步成为主流。

“不依赖于数据库告诉你磁带编号或条形码,你就可以找到磁带上的内容。假设你使用了LTFS,你就可以像在文件系统中一样搜索文件。LTFS在这方面有很多优势”他说,“这将是LTFS使用普及的一种催化剂。”

Randy Kerns是科罗拉多州Evaluators集团的存储分析师,他说媒体和娱乐行业需要更高效地传输数据,这非常适合使用LTFS。归档管理软件可以部署在LTFS的顶层,这样用户可以标注保留期限和数据访问控制——一旦更多的归档管理软件支持,这种技术很快会成为主流。“这才是真正意义上的管理归档而非备份搜集,”他说道,“公司可以用磁带实现更多的功能,而非简单的备份。”