专家博客 应用自动分层系统要考虑的问题

本文作者George Crump是Storage Switzerland的创始人,同时也是George Crump Consulting的创始人。 

虽然包括我在内的业内人士积极赞美自动分层技术的优点,但是对于存储管理员来说重要的是不要将自动分层技术看成是万灵药。当然,自动分层技术有许多优点,但是你也需要注意一些潜在的问题。从性能的角度看,大部分(即使不是全部)自动分层系统都是使用SSD(固态驱动器)或RAM(随机存取记忆体)来加快I/O和减少延迟性。就像我们已经讨论过的,这种做法的好处在于它可以让存储管理员自动地利用SSD,缺点在于整个环境的其他部分也必须足够快才能够充分利用它的优点。在系统终端部署一个非常快的驱动器并不一定能带来更好的性能。

对于一些环境来说,这意味着SSD所能处理的数据量相对比较少。在整个自动分层系统上进行大笔投入,如果反而只得到一丁点的性能提升,这肯定不值。例如,如果服务器上的一个应用程序需要I/O性能提升,那么在服务器上直接安装一个基于PCIe的SSD可能会简单和便宜得多。当然,并不是所有数据中心都如此。你需要确保自动分层所带来的性能提升在你的环境中是值得的。

一些自动分层解决方案的其他目标是通过将非活跃数据迁移到SATA存储层来减少成本,并减小购买更多光纤或SAS容量的必要性。在这里,环境中其他部分的性能水平并不是问题。自动分层系统只是为了处理好旧数据,而许多数据中心多的就是这种数据。不过,这里的问题是你的主存储系统并不是为了在更长的时间内存储旧数据而设计的。大部分系统没有数据保留功能来确保数据得到锁闭和保护。在这种情况下,我仍然倾向于归档-到-磁盘的方式,当然,也可以利用文件虚拟化功能使旧数据到这些归档的迁移过程自动化。不过,在真实世界中,你可能不想采用归档层这个概念,或者说你无法让客户对归档层这个概念买账。在这种情况下,利用自动分层来减少主存储成本是有效的。

除了文件虚拟化外,用户担心的另一点就是将数据分解成各个小块然后分散在不同的存储层会不会带来新的问题。为了解决这个问题,你要找的是在数据精粒度操控上有经验的厂商而不是寻找专注于存储容量的厂商。同时,在测试的时候,你要确保你测试过在进行卷或数据库大型恢复的时候会发生什么问题。比如说,自动分层的智能是如何处理这种数据流入的?

至少来说,自动分层是一个流行概念,而且它可以为一些数据中心提供有价值的服务。在你接触这个新技术的时候,你要确保你已经了解你的环境中哪些部分可以利用这个技术以及你有什么样的长期数据保留需求。