专家博客 ILM正在迎来最好新的机遇

本文作者Howard Marks是Networks Are Our Lives公司的首席科学家。这家公司总部位于新泽西州霍博肯,从事顾问工作。1987年以来,他一直专注于系统的分析和写作。 

不可否认,大多数组织充满了各种非结构化数据。虽然大多数人都同意说文件应该根据它们随着时间而变化的价值来进行适当地存储,但是很少有组织能够真正良好地管理他们的文件。厂商们已经进行了多番尝试,开发出各种工具来自动地管理非结构化数据,称之为HSM(分级存储管理),后来是ILM(信息生命周期管理)。但是ILM这个概念还没有得到广泛接受。

我同ILM厂商的一些前管理人员和IT专家进行了交流。我想我理解了为什么FAN、ILM和HSM没有流行起来的原因。

首先,存储成本的降低–部分原因是公司对SATA驱动器的接受–已经使得Doritos方式的文件管理变得可以承受。过去10到15年来,我们定期地进行升级,从Netware和Windows文件服务器升级到更新一代的NetApp和Celerra NAS(网络附加存储)。这种升级只需要将数据拷贝到更大的系统和更大的驱动器。如果系统在技术升级的空档时间内容量满了,只需要再增加新的250GB或1TB驱动器。这种驱动器的成本要低于F5/Acopia虚拟化交换机或Scentirc软件,而且不需要大动干戈。

其次,数据分类和数据迁移工具太复杂和昂贵。如果要根据文件系统的最后访问时间将相关文件迁移到更低层的存储层,需要1万美元/TB的成本。尤其是最近访问日期有可能反映的其实是不知道保留元数据的初级管理员在上一次将数据迁移到新文件夹的日期,或者反映的是用户搜索文档的时间。此外,被迁移的数据被标签所取代。这个标签可以在用户进行内容搜索的时候将文件从较低的存储层中恢复回来,不过这看起来不值得这么做。

最重要的是,IT人员对数据的背景既不够关心也没有足够的了解。IT人员,尤其是存储人员,担心的主要是如何保持OLTP(联机事务处理)系统的平稳运行。这是公司的盈利所在。用户虽然知道去年销售会议上的PowerPoint文件基本上不会再被人们所使用,但是他们没有动力来帮助IT人员进行更好的管理。

我认为,商业和数据中心环境已经发生了足够的改变,需要对ILM进行新的尝试。当然,我们需要给它一个新名字。许多数据中心容量很满,而电能却不够用。预算正在被削减,而且短期内无法恢复到原来水平。最要命的是,大量的MP3文件和工作簿文件需要IT人员用越来越多的时间来备份和管理

系统分层,比如Compellent的系统、EMC的FAST(全自动存储分层)和赛门铁克的Dynamic Storage Tiering(动态数据分层),给SSD(固态驱动器)带来了很大的应用空间,并使得更高的驱动器密度成为可能,不过这些系统还不能解决完全管理和备份问题。幸运的是,过去的失败并没有阻止新的厂商–比如Autovirt和Seven10–对此发起冲击。