存储初创公司并未能令世界为之疯狂

欢迎阅读软件在线文章《思科CEO钱伯斯称世界正步入"互联网2.0时代"》>>

试试能否接受这样的观点:根本不存在大规模文件存储问题。为了解决那个问题而建立的许多企业未能令世界为之疯狂,而过度投资的一些厂商如ONSTor和Copan等则面临着许多的难题。

同时,模块存储SAN二次创新厂商如3PAR和Compellent则取得了更好的成绩,客户不需要通过一个解决方案来解决文件过多或过大的问题。之所以不需要这样的解决方案是因为这样的问题根本就不存在。

以前的设想不是这样的。几年之前,许多工程师、营销专家和企业家都预见到会出现一个文件存储的问题。媒体行业从模拟转向数字存储将生成数百万甚至数十亿个图像文件、音乐文件和电影文件。电子邮件就象流行感冒一样迅速风靡全球,电子邮箱中充斥着无数的邮件、附件,其中有许多内容是重复的。协作软件如Lotus Domino和SharePoint等也导致数百万个文件被创建出来。

非结构化信息正在普遍和持续地增长,为了以备不时之需,需要将那些信息全部保存下来。那些信息为永久性信息或参考信息,分别被保存在各个企业的文件管理器仓库之中,不能排列或通过合适的手段进行搜索。 合规性和电子发现的需求曾经而且现在仍然经常被用来加强这些产品的客户需求。

存储被分为两类,一类是模块和文件的直接连接存储器(DAS),另一类是文件的网络连接存储器(NAS)和模块的存储局域网(SAN)。SAN已经开始对物理存储器进行虚拟化,但是文件存储器却没有这类技术,NAS的统一性远远不如SAN。

企业家、开发人员和工程师们都密切关注着这个领域并发现了巨大的商机。他们在存储厂商内部启动了许多计划,甚至创办了新的存储厂商来开发新一代关键存储产品。 那些新产品可以解决文件存储的问题。

它们用来解决这个问题的方式是不同的,但是事后来看,它们都犯了一个相同的错,那就是把问题设想得比实际更大更复杂了。

四类文件存储问题

第一个是磁盘转速下降。Copan和Nexsan以及其他厂商认为,减轻文件存储问题的复杂性的方法是减慢磁盘转速并综合考虑另外两个支持因素。其中一个因素是大都市地区供电不足以及削减碳辐射量的环保问题,另一个因素是数据中心空间受限的问题。 如果通过降低磁盘转速的方式来削减耗电量,那么你就可以同时降低供电和空间两方面的需求。你可以在更小的数据中心占地空间条件下使用更少的电能储存更多的文件。 这是一举三得的胜利。

第二,文件虚拟化。你在应用服务器与各种文件存储器之间插入一个特殊的服务器,将所有的文件存储器中的所有文件都放到这个分配了全球域名空间的服务器之中。 将文件存储器虚拟化,让它看起来就好像只有一个文件存储器。Acopia和Rainfinity以及FilesX均尝试过利用这种方法来解决文件存储器的问题。

第三,通用归档存储器数量激增,以EMC的Centera最为明显。其他厂商如Caringo、Mimosa和Waterford等也都在向这个方向努力。 Plasmon也曾努力并失败。许多人认为Centera的价格太高,从而改用常规硬件或开源产品。 但是那些产品没有一款能够超越Centera,因为它们本身还不够完善,而且也不存在普遍问题来推动其产品的普及应用。

相反,具体归档产品则生存下来并逐渐发展成具有良好合规性和电子发现功能的常规归档产品。这类产品存在着一个发展的市场,但是它没有早期产品开发商希望得那么大或者普及。

第四,我们发现有的厂商通过scale-out文件管理器来解决问题,它们通常利用某种形式的群集同时向一组服务器的大量文件提供服务。大文件可能会被分成多个小文件。 Ibrix就开发过这类软件。BlueArc则开发出FPGA硬件加速超级NAS产品。 Isilon、Exanet和ONStor开发出群集文件管理器硬件和软件。这里仍然存在一个问题,但是客户的兴趣转向并集中在两个并不普遍的领域。

数字电影效果意味着编译电影画面需要大量文件传输能力,Isilon、Ibrix 和BlueArc因此受益不浅。它对于模块存储供应商如PolyServe和Data Direct Networks等也很有利,但是我们这次不谈这个问题,因为这篇文章将专注于文件。

高性能计算和超级计算也需要同类大文件带宽来处理地震、仿真和基因类型的数据。然而普通的商业公司并不需要它们。

ESG的Steve Duplessie指出,象亚马逊、谷歌和雅虎那样的Web 2.0公司自己也需要scale-out文件管理器,有时它们会建设自己的相关基础设施。 但是我们的scale-out NAS厂商们并不能从中受益,它只能适用于这类大型网络服务供应商,对日常业务没有什么用。

并非一个普遍性问题

这四类初创公司并没有意识到业务普遍性可能是内容。NAS设备保持的数据越来越多,利用现有文件存储进程比引进一些没有尝试过的新概念如Copan的MAID、Isilon的群集或Acopia的文件虚拟化等等更加容易。

它们还过分高估了合规性和电子发现的影响。这主要是由于有些人会散布谣言:看看某某因为没有及时提交某个文件而被罚了多少罚金啊! 没人敢购买这些初创公司的产品,现有文件管理器厂商利用现有客户缓解了它们在合规性和电子发现方面的顾虑。

希望通过四位一体的方式解决文件存储问题的初创公司们遇到了其他的问题。低于文件级的重复数据删除技术消除了拥有其产品的主要理由,特别是它们在现有备份软件和基础设施上工作时更是如此,看看Data Domain的成功就知道了。 专业重复数据删除厂商建立和开发产品以及发展业务的速度比我们关注的上述四类文件存储问题解决厂商更快。

在最近2年,EMC和IDC做了一项不错的工作,即令所有人都明白了媒体、社交互用和智能设备通信的数字化的存储后果。文件存储问题先锋们的做法将被证明是正确的,但是这却没能给它们提供任何帮助。

它们生存的基础是一个被夸大了的问题。因此,它们通常不能对产品的有限需求进行投资,也不能在大厂商赶上它们并抢走其市场发展前景之前开展相应的业务。 强者恒强的古老定律在这里又发挥作用了。

它们没有一家厂商发展起来。文件虚拟化也悄无声息了。 在归档中使用持久性存储器是一个不错的想法,但是其需求本身过于有限。群集scale-out文件管理是个不错的发展方向,一旦它成为主流技术,重要的供应商们就打算对它进行投资。 不管选择何种存储阵列,云存储归档或许都是个不错的选择。

本文的前提是不存在大规模文件存储问题。我断言现在也不会存在那个问题。 存在问题的领域比以前更大了,但是目前尚无迹象表明企业用户会普遍需要一个大规模、可调整的、配备全球域名和基于绿色磁盘阵列的合规性和电子发现设施的文件存储管理方案。

有些企业或许需要其中的部分产品。但是并非所有的企业都需要。这也就是为什么有些初创公司能够成功,重要供应商拥有特权的原因。