DoSTOR专家观点 考量面向文件的自动精简配置

DoSTOR专家观点:本文作者是业界咨询公司Silverton Consulting的总裁Ray Lucchesi,他及他的公司一直专注于企业用户的产品、解决方案应用以及新技术的咨询服务,并帮助用户规划其存储系统架构和数据中心存储发展计划。

基于文件系统的自动精简配置技术(thin provisioning)自从2002年首次推出以来,其与块级存储系统内的自动精简配置技术都获得了前所未有的爆炸式增长。到2004年,绝大多数NAS厂商都提供这项技术,以便缓解一些与文件系统增长相关的问题,并且众多的数据中心很快便感觉到了针对NAS用户的自动精简配置技术的好处。事实上,一个曾经接受采访的NAS企业声称在其整个数据中心中资源利用率高达90%。

自动精简配置(thin provisioning)可以比作一间里面有很多可充气膨胀的储藏室的空房子。每个储藏室一开始都需要充一定的气才能起来。根据增长需要,它们每一个都独立地膨胀到所需要的水平。每一个储藏室都有一个膨胀的上限,这些可充气膨胀的储藏室总体上都不能膨胀到超过这间房子的大小。以此类推,我们把房子里面的储藏室看成是文件系统,房子是可用的存储。

与此相比,传统的硬件配置方法就像是一个由很多永久性的石头城堡组成的城市。城堡大小的极限取决于完成的地基。以后,还有可能需要对城堡进行额外的扩建。

部署了自动精简配置技术的文件系统更像是便携的可膨胀物,能够自动地扩展到一个预先规定的最大极限。这些预先规定的极限在配置文件系统初始空间配置时进行定义。在Windows下考察文件系统的用户会将该驱动器代表尺寸的字符看成是初始配置尺寸。

当将数据写入部署了自动精简配置技术的文件系统并且数据超出了它的初始空间配置时,文件系统就会自动地扩展,无需操作人员或用户的介入。随后的写入操作继续无缝地扩展直至达到最大的极限或直到操作人员人为干涉为止。

在大多数部署了自动精简配置的文件系统中,能够自动扩展不意味着能够自动收缩。事实上,只有少数几家公司的产品当不需要的文件被删除时自动收缩文件系统(回收存储空间)。绝大多数厂家的产品将删除了文件的空间用于随后的文件写入,保留"被扩展"的文件系统空间配置不变的状态,不再释放空间。

大部分采用自动精简配置技术的NAS厂商既支持CIFS也支持NFS。当自动精简配置技术被装入标准的CIFS 和 NFS文件协议时,也就意味着它不需要专门的主机软件。

通常情况下,部署了文件的自动精简配置技术后,文件系统能够自动地扩展。当空间被"软"或"硬"分配时,自动扩展功能在NAS高级服务器中是可用的,并且支持其它文件系统厂商的产品。例如,在20TB NAS系统中,文件系统"A"可能初始配置4TB的空间和另外4TB备用空间(共8TB)。超过4TB初始配置,文件系统就会按需要增长,最大可达8TB。

在20TB NAS系统中,或许意义更大些,更多的文件系统能够被配置到厂商规定的最大极限。事实上,累积的最大极限值甚至可能超过实际可用的存储。允许各文件系统独立地、按需要地扩展,直到实际累积的应用达到最大容量(20TB)。

相比之下,采用20TB NAS系统的传统的硬件配置方法,预计未来会增长到8TB的文件系统"B"一开始就应该配置成全部的8TB。未来有空间调整需要时,无论是增长还是缩减,都要使用配置的空间或经管理员干预。

带给数据中心的益处

文件系统自动精简配置的最大好处就是能够延迟存储容量费用支出直到绝对需要为止。也就是说数据中心能够根据需要及时地购买增加的容量。同样以上面陈述的例子为例,根据初始配置,经自动精简配置处理的NAS设备拥有16TB 可配置的物理空间,而传统的硬件配置方法的NAS设备是12TB的可用空间。这个比较是超简单的,经过这种比较,人们会做出这样的结论:与实际可用的物理存储空间相比,自动精简配置的NAS设备能够配置的最大文件系统空间要大得多。

例如,假设20TB的自动精简配置NAS设备,四个文件系统每个初始配置4TB。与相似大小的传统的硬件配置方法的NAS设备不同,这些文件系统每个可以被配置到8TB的最高极限,可能超过了实际的存储容量。事实上,自动精简配置技术允许在很少或根本没有操作人员干预的情况下,每个文件系统单独地增长直到单个文件系统达到它预先设定的最大配置值或达到使用的总存储容量为止。

自动精简配置文件系统的这种超额配置的能力具有另外一个重要的益处:文件系统的空间估计可以不必太精确。事实上,采用自动精简配置文件系统,所有的文件系统都可以被配置到厂家支持的最大尺寸。

有关自动精简配置技术的注意事项

尽管自动精简配置技术在节约成本方面具有显著的效果,但是不是所有的IT数据中心都适用这项技术。自动精简配置文件系统必须在操作人员的密切监测之下运行。如果没有具备这种监测能力的人或者这人不愿意做这种监测工作可能会产生灾难性的后果。如果允许自动精简配置文件系统使用所有可用的物理存储空间,那么所有未来的写入操作都会被终止。同样,当文件存储消耗达到了可用容量的50% 到80%,应该考虑增加更多的存储。

另外,几乎没什么疑问,由一些不提供自动精简配置技术厂家提出的值得注意的事情是对多文件系统的全面需求,从而引起对自动精简配置技术的需要。这些厂家争论说,一个文件系统和一个存储池不需要自动精简配置。虽然这个争论可能很有价值,但是另一方面—-多文件系统——也有它的价值。事实上,多文件系统能够增强某些IT操作性能,诸如目录查找,机构成本分摊(chargebacks)和空间管理等性能。

近似自动精简配置方法

某些文件系统支持基于块的自动精简配置存储。虽然文件系统必须被传统的硬件配置方法到自动精简配置的LUN,但是实际上,在这些系统中使用的总物理存储可能与自动精简配置的文件系统几乎相同。然而,为了保留自动精简配置技术的最大的优点(即保存实际的物理存储空间),传统的硬件配置方法的文件系统必须在消耗新存储空间前重复使用删除文件的空间。

有保障吗?

在少数的几个特殊情况下,自动精简配置的文件系统的确没有什么保障。这几种情况具体如下所述:

没有持续操作监测的IT中心。因为自动精简配置提供自动文件系统扩展的功能,所以数据中心能够很容易地被平稳的操作"催眠"。如果准许自动精简配置的文件系统消耗所有可用的物理存储,所有的写入操作都会被禁止。

高性能文件系统。在某些IT环境里,一些文件系统被高度优化,将某些文件系统流定向到高性能硬盘空间。然而,自动精简配置通常不具备位置敏感性(即所有的磁盘存储作为一个单独的可用于文件扩展的存储池进行维护)。同样,高性能文件系统可能很快变成优化程度极低的系统,因为新数据会被路由到低性能的存储。

具有繁重顺序写入工作负载的文件系统。自动精简配置的自动文件扩展功能具有一些与之相关的操作成本。每次文件系统需要扩展时,自动精简配置都需要一些处理开销。同样,负责繁重的顺序写入工作负载的文件系统也需要消耗成本才能完成任务。

具有超大文件和/或巨大数据工作负载的超大型文件系统。数据中心就像大型的研究实验室或收集信息的设备,每天处理大量的同类数据。在这种情况下,多文件系统会显得很笨重。在这些环境内,一个巨大的文件系统是更理想的选择,因此,自动精简配置没有什么优势。

与其它业务分摊(charge back )IT 费用的数据中心。在大多数情况下,自动精简配置存储的用户只意识到了使用的实际空间。但是,很多IT数据中心分摊(charge back)了最大文件空间配置的费用。因为这些数字可能非常不同,从而引起机构间的冲突。为了解决这个问题,一些厂商已经修改了报告,使其反映最大值而不是实际空间。

面对今天不断增长成本的数据中心,文件系统的自动精简配置技术为希望节约数据中心成本的人提供了很好的选择,采用这项技术可以延缓购买存储并且可以及时地购买容量。然而,如果自动精简配置文件系统没有得到密切地监测,自动精简配置技术所具有的好处就不复存在了。对其它被隔离的,更独立的文件系统的需求也可能超过自动精简配置所具备的优势。但是,一般来说能够不间断地执行监测的数据中心应该选择自动精简配置技术,充分享受它带来的好处。为文件系统提供自动精简配置的厂家包括EMC, Network Appliance (以及 IBM, 其 OEM了 NetApp 系统), BlueArc (和 Hitachi Data Systems, 其 OEM了 BlueArc 系统), 和赛门铁克。