DoSTOR存储分析 磁盘归档和对象管理

本文作者George Crump是Storage Switzerland创始人,他为存储客户、供应商以及集成商提供战略咨询和分析。此前他曾在瑞士最大的集成商之一担任CTO。

对于2009年来说,最安全的预测是,尽管经济放缓,不过数据中心的性能提升需求仍将继续下去。目前的挑战是,经济的持续放缓将使得在昂贵的主存储上存储数据成为一件很痛苦的事。

归档,具体地说,是磁盘归档。今天的磁盘归档系统,如那些来自Nexsan,Permabit和EMC的产品,已经克服了许多的限制以及光学存储的障碍,这些障碍曾促使我在早期做出"光存储完蛋了"的预测。对于在主存储上存储旧数据来说,它们是目前最可行的替代办法。

我要向归档供应商道歉。我觉得,磁盘归档就像是一个繁杂的数字转存集散地。你想要方便地将各种东西扔进去(转存),这些数据被废弃、遗忘,直到你需要找到它的时候(搜索)。最理想的情况是,归档系统只是留在那里接受数据并且充分保护自己。唯一的互动是只是在存储空间的增长上,而且这还是自动添加的。

磁盘归档提供易于访问和易于扩展性,这使得他们对于紧缩开支的数据中心来说非常有吸引力。然而,当用户希望能将百分之八十的数据进行归档,磁盘归档显然必须进一步迎接日益增长的存储需求的挑战。

大多数归档是基于CAS(内容寻址存储)系统的。数据细分为文件级或子文件级,并且有一个唯一的ID"指纹"。因此,存储在CAS的数据互相之间毫无关联。在CAS上存储一个类似的文件时,系统将建立一个指针指向原始数据集,而不会存储数据的第二个副本。

这些指纹被称为"对象" ,目前一些CAS系统对于有多少对象可以存储在该系统上有一个较低的限制。它们只有一个单一的目的–比如,电子邮件归档或储存医疗记录。随着越来越多的客户开始充分利用磁盘归档易于访问的性质,并开始在磁盘归档上存储一切旧数据,存储这些文档的数据量将大幅度增加,"对象"的一致率也会提高。现代归档系统必须有能力支持几乎是无限多的对象。

这一点很重要,因为如果你达到归档系统可以支持的对象数量的最大限制,你就需要实施二次存档。这会是让人比较难受的磁盘归档历程,因为如果第二存档不能共享第一归档的对象级别信息的话,多余的数据有可能被存储下来,或者一台设备上的归档保存策略将不能同另一台系统所匹配。其结果是,不同的对象限制增加了管理系统的时间。它当然不符合建立一个设备来存储所有数据的需求。

因此,我们迫切地想知道一个数字。什么时候对象的数字会膨胀到出现问题,并开始影响性能,以及供应商如何解决它?我的下一篇文章将详细介绍这个小秘密。