本文作者本文作者为George Crump,他是Storage Switzerland公司的创始人, 具有二十多年经验的独具存储咨询顾问。
肯定有人以为我是在开玩笑,我们如何才能够将磁盘绿色的加入到基于磁带的处理流程中?毕竟,磁带是一个最终的绿色技术。在不使用的时候,磁带静静地坐在一个塑料的盒子中,被放置在一个像是图书馆或是“墓穴”一般安静的地方。因此,我们必须考虑如何利用重复数据删除技术来让磁盘更“绿色”?
首先,让我们正视现实,出于多种原因,大多数用户都有添加磁盘的战略,无论是正确的还是错误的,这都是必然在发生的,而我不认为这会停止。目前最大的挑战是,增加磁盘可以是以任何的形式,即使使用MAID技术,或是最终将数据备份到磁带上,能够减少额外的能耗。因此,平衡,是最重要的:如何通过添加磁盘得到改善备份过程,而且不需要一张新铺设的电网。
现在这里有两种技术让你对绿色提起兴趣:重复数据删除和MAID。首先让我们看看重复数据删除技术,这是一种能让我们的磁盘阵列更绿色的方法。其最核心的优势就是能让你只在初期购买较少的磁盘容量,而随着存储与备份工作进行之后,能够大大减少更多的容量的增加。
通过重复数据删除,你的第一个完整的全系统备份将会受到这项技术大大的影响。大多数用户会仍然会在进行了重复数据删除和压缩之后利用一些优化手段,因为重复数据删除对系统此后的备份尤其是增量备份并没有太大的影响。
对于重复数据删除来说,不同类型的重复数据删除也将影响电源效率。不过,在这里我并不想再谈在线和后处理两种方式的不同,而是把重点放在你的系统如何选择和执行后处理的不同上,如果你需要基于存储效率的绿色要求,那么你需要在流程中尽可能优化,但问题是,在进行重复数据删除之前,你到底需要购买多少的容量?
在线处理模式在向磁盘传输数据之前就对存储效率进行优化,并且只有一个存储区域,因此进行重复数据删除之前和过程中不需要额外的存储空间。后处理方式不需要特殊的存储区域来保存本地数据和重复删除数据,在启动重复数据删除流程的同时不会影响其他备份流程,而且还可以在标准磁盘中提供存储效率和能源效率。
当然,如果你的重复数据删除系统是post-processing类型的,需要大量本地存储空间来保存备份副本和原始恢复数据,并以此提高输入和输出性能,但是,这回降低存储效率,提高能源消耗情况。性能往往是推动用户对本地存储空间需求的原因之一,这些系统中有些很可能不能同时维持输入备份性能和重复数据删除处理时的性能。因此,用户需要有一个本地空间来进行重复数据删除操作,同时不会影响到备份性能。其中一些系统在从重复删除数据中进行恢复的时候其恢复性能会大大降低,推荐这些用户采用本地空间来进行快速恢复。
所有影响存储效率和容量的因素最终都会影响到存储的能源效率,这个问题不仅仅是为了保持存储系统有足够的本地空间,而且保证为存储的增长提供足够的开支。相比之下,在线处理方式可以在备份过程中优化系统性能,需要的空间应比输入数据所实际需要的要少。虽然企业机构仍然为输入备份提供额外的存储开支,但是这些开支主要是用于优化(主存储)容量的,而不是本地(备份系统)容量。
问题的关键在于数据最后存储的地方(landing area),对于不能够马上删除掉所有的重复数据的后处理方式来说,用户需要足够的空间来保存临时的大量输入的备份数据,而且往往是全盘备份的空间大小。此外,还需要足够的空间来保存删除掉重复的数据,要知道,所有这些因素都会影响重复数据删除技术的“绿色”。