DoSTOR专家观点 如何建立绿色的磁盘到磁盘备份

DoSTOR专家观点:本文作者为George Crump,他是Storage Switzerland公司的创始人,具有二十多年经验的独具存储咨询顾问。

最近这段时间,在存储管理者所面临的众多优先考虑的部分中,有两个部分看起来似乎是互相排斥的:磁盘到磁盘(D2D)备份似乎和节约电能相矛盾。

存储专家们在2008年部署磁盘到磁盘备份,或者扩大其这方面的投资,以提高数据保护性能和获得可靠的数据恢复。和传统的基于磁带的数据保护比起来,磁盘到磁盘已证明能够缩短备份窗口,提高恢复速度,并提高一些麻烦的备份流程的可靠性。

同时,存储专家们面临着电能使用方面的危机。这不仅是因为绿色顾虑,而且是因为日益增长的电能需求。一位首席技术官最近告诉我:"我不关心是否绿色。我只是得不到足够的电能来支持我的数据中心"。

不幸的是,虽然有种种缺点,磁带还是在这方面胜过磁盘解决方案,它非常节省能源。我们来看:装满一个硬纸板箱的磁带也消耗不了多少电能。即使这些磁带因为需要一些存储耗材、需要让卡车来搬运、以及相关的温度控制设施,而消耗相关资源并产生一定的环境影响,磁带还是比D2D解决方案要节省能源。

问题是:我们可以添加或扩大磁盘到磁盘备份而无需面临电能问题吗?

幸运的是,答案很可能是"是"。我们来更仔细的观察这个问题,并系统地总结D2D所使用的技术,以及有那些方法可以提高其能源效率。

基本考虑

在我们进入问题的中心之前,需要回顾一下两个基本原则:第一,更有效的空间利用(在更小的空间内存储更多的数据)。对于能源效率问题,它是最实际的解决方法。第二,变得更加绿色需要更多的能够提高能源效率的技术。

就实际情况而言,在2008年,服务器虚拟化和存储虚拟化的道路代表了能够用更少的物理空间以及更少的能耗来存储数据的方式。在存储上,重复数据删除是另一种能够更有效利用电能的技术。更少的物理服务器或物理存储意味着更少的能源需求。

但是诸如虚拟化和重复数据删除这样的技术并不能凭空存在。要想切实提高磁盘到磁盘的能源效率,就需要检查每个产品类别的能源消耗以及如何提高其效率。

下文中所使用的各种比较数据都是基于各厂商的公开能耗规格。虽然每个数据中心的部署都是独一无二的,但是从百分比来看,其不同技术之间的差异是类似的。

D2D产品类型:虚拟磁带库(VTL)

电能消耗:每可用TB大约消耗80瓦

解释:虚拟磁带库并不直接产生绿色效果。如果正确部署虚拟磁带库,它可能可以成为其他能耗节约方案–比如MAID(大规模非活动磁盘阵列)或重复数据删除–的推动者, 但是现在,传统的虚拟磁带库只是一堆未受优化的SATA磁盘架的前端机架罢了。这些磁盘架是数据中心中的耗能大户和热量产生大户。

如果你决定通过广域网连接到灾难恢复站点,并复制你的磁盘备份,那么情况就更糟了。由于虚拟磁带库解决方案缺乏空间效率,因此你必须在灾难恢复站点重复投资于同样的容量。当然,结果就是双倍的电能、冷却和成本开支。平均来看,大部分标准虚拟磁带库解决方案所每使用一可用TB容量,就需要消耗大约80瓦电能。此外,由于没有容量优化,必须重复整个备份,因此灾难恢复站点必须通过一个非常高带宽的网络进行连接,而且站点距离也不能太大。

将传统的虚拟磁带库进行优化的第一步就是压缩磁盘中的数据,类似于压缩磁带中的数据。虽然这样可以将电能消耗降低到每可用TB 50瓦,但是这样做也会带来问题。

第一,大部分的虚拟磁带库解决方案在使用压缩的时候都会损失超过60%的性能,而且在备份流程中接收进入数据的能力也会受到严重影响。这和备份流程中加入磁盘的主要目的之一相违背–缩短备份窗口。

磁盘上的压缩同时也复杂化了磁带的情势。如果你使用磁带–在大部分虚拟磁带库解决方案的情况下你都会这么做–那么你一般不可能传送那些已经压缩到磁带的数据,并用磁带驱动器来压缩这些数据。你将需要关闭磁带驱动器上的磁带压缩。

另一个可能的解决方案是将虚拟磁带库中的磁盘部分变小,并将从磁盘到磁带的备份速度加快。通过这个策略,你在数据恢复上对磁带的依赖程度就和你刚开始D2D行动的时候一样。

对于大部分客户来说,他们的目标就是希望磁盘上的备份能够保持足够长的时间,以满足大部分恢复请求。而且有越来越多的这种客户希望在整个数据保留窗口内都能够保持磁盘上的备份,完全排除磁带。

结论:如果考虑绿色IT或能源消耗,那么那些不能够提供某种形式的优化能源效率的功能或技术的虚拟磁带库厂商不在D2D讨论之列。

D2D产品类型:大规模非活动磁盘阵列(MAID)

电能消耗:每TB大约消耗7到28瓦

解释:MAID是一种替代措施。MAID本身只是针对磁盘,可以降低磁盘旋转速度,减少闲置磁盘或被访问磁盘在一段时间内的电能消耗。对于MAID来说,一个明显的市场就是磁盘到磁盘备份,特别是那些对能源敏感的数据中心。

为了构建一个D2D解决方案,大部分MAID厂商和虚拟磁带库制造商合作。检验MAID解决方案的第一步就是了解虚拟磁带库组件提供商的优势和劣势。MAID是通过降低磁盘电能消耗的技术来解决能源问题的,而不是通过容量优化。因此要想充分利用这种技术,需要和虚拟磁带库解决方案密切结合,以确保新数据不会被写入包含旧数据的同一个磁盘。

简而言之,你不能自己搭配和组合MAID和虚拟磁带库解决方案。你必须使用你的MAID厂商所选择的虚拟磁带库。如果VTL-MAID组合可以被接受,而且MAID技术运行良好,那么你就可以将电能消耗降低到每TB 7到28瓦这个区间。和标准的虚拟磁带库解决方案比起来,这种方式明显降低了电能消耗。

一个告诫:开启和关闭磁盘驱动器电源通常会给IT专家带来一定程度的困扰。当你启动某种技术的时候,我们中的大部分人都会经历一定的令人不安的时间,特别是真的关系到电源开启的时候。为了解决这个问题,MAID厂商提供了两种替选方案。你可以设置例行任务以确保当你需要磁盘的时候这些磁盘将会启动。你同时也可以延长磁盘降速的时间间隔,以减少不能及时启动磁盘的风险。这两种方式都能带来一定影响,并可能将电能消耗推高到每TB 7到28瓦区间的上限。

一些MAID厂商计划采用重复数据删除技术,有些已经在发布这项技术了。他们很可能采用后处理的重复数据删除技术,当然这样他们也将面对所有后处理解决方案所遇到的问题。除了这些问题以外,我们还不确定MAID厂商如何部署重复数据删除技术,部署这项技术有可能会加重磁盘负担,如何平衡其中关系以保持其能效优势也是个问题。

结论:当考虑MAID的时候,需要在最优能耗和最优空间利用上做出抉择。

D2D产品类型:具备重复数据删除技术的产品

电能消耗:每可用TB大约消耗1.3瓦到2.8瓦

解释:重复数据删除是一种数据删减技术。它将正在写入磁盘的数据部分和已经存在该磁盘上的数据部分相比较,如果发现重复数据,那么将在原始数据上添加一个标志符,而不是存储重复数据。这种技术能够对冗余部分进行"重复数据删除",或将冗余部分移除出存储系统。

重复数据删除技术很容易使用,而且能很快奏效,并且还比较具有经济性。如果重复数据删除的效率为10X到20X,那么在单个重复数据删除设备上的每可用TB的电能消耗将为1.3到2.8瓦。

对于D2D备份来说,重复数据删除系统并不仅仅意味着能耗节省。它们还可以对数据进行一致性检验,最重要的是,能够用最小的带宽根据远程站点的存储和电能的需求来复制数据。

特别是,重复数据删除和虚拟磁带库可以组合,而重复数据删除和MAID则不能,起码是不能达到最优效果。MAID需要停止一些磁盘;而重复数据删除需要对卷之间的数据部分进行交叉参照,因此也意味着所有的磁盘都必须可用。

虽然许多虚拟磁带库厂商在他们的解决方案中增加了重复数据删除功能,但是一般只是作为插件,甚至只是一种OEM关系。因此对那些刚刚接触重复数据删除的厂商,他们还不能做到无缝整合并排除整合中的问题。

结论:在所有这些优化D2D的方法中,内线(In Line)重复数据删除系统是"最佳"的技术,它能够改善备份流程和能源利用率。重复数据删除通过优化磁盘容量,并且在更少的空间中存储更多的数据,能够解决电能、冷却以及空间消耗问题。