存储分析:将数据备份应用和云存储整合

现在你还在将数据备份到旧磁带上吗?还是磁盘或者已经是消重后的磁盘?如果现在有人告诉你,有一种备份设备没有容量上的限制,并且管理起来也是非常的方便,你是不是会非常的开心?云备份就能实现这样的效果。如果你对此还有怀疑,请阅读下面的文章。

市面上有许多的产品和服务都随意的挂上了和云相关的名字。显而易见的是,大家都希望能在云方面凑一下热闹,这看起来就好像每个人对云概念本身都有着自身的定义。正是基于这样的没有标准定义的背景下,本文旨在通过讨论的形式来谈论对云的定义。

说起云,一般均指公有云,指的是你不用管理的存储或者备份。公有云有着不受限制的存储空间以及可以随意增长的容量,从成本上讲也大大的低于自己花钱完成这一切。如果你需要的是这个月付100TB存储的钱而明年仅需要付5TB存储需要的钱,那么云存储是一个不错的选择。这是购买普通存储设备而不能享受到的灵活性,对于普通存储,因为你已经购买它了,所以不会因为你是否使用了它而造成收费的不同。

当然也有私有云,市场上关于私有云夸大其词的概念不在少数。本文仅仅讨论有关公有云的概念。

云存储 vs. 云备份

尽管这两个专有名词会经常的交叉使用,实际上再云备份和云存储之间还是有区别的。云存储实际指的是将存储作为一项服务。在使用云存储资源的时候,你首先需要从云服务提供商那里获取一个账号;他们会提供给你他们的API接口,这样你就可以使用相应的软件在存储数据的时候使用对应的API接口。就是这样简单,你可以轻而易举的实现无限制的容量。在云存储里,你无需管理存储数据的设备,甚至不需要申请更多的空间,因为容量本身是无限的。你唯一需要做的就是付款。所有的云存储服务提供商所收取的费用仅为“数据托管费”,一般来说是每月按照你的账户上存储了多少GB数据的容量来定。此外,一些云存储服务提供商可能还会根据每GB大小数据下载和上传的量收取相应费用,本质上就是“带宽使用费”。在云存储的帮助下,你仍然需要去管理那些用于将数据上传到云存储的应用软件。

云备份作为一项服务,它需要提供所有的服务包括使得备份开始的软件。一项云备份服务通常会提供针对不同客户端备份的软件。备份需要有规律的按照计划好的时间按时开始。备份软件通常使用比如说德尔塔级别的备份或者全消重技术来最大程度的降低网络上的负载。

云服务提供商的服务水平协议以及所收取的价格将最后决定在出现状况的时候会采取怎样的措施。至少,云服务提供商会提供一个弹出式的通知或者电子邮件信息向用户更新最新进展。服务中还可能包括自动将问题提升到相应人员的功能,尤其是当备份失败的信息被核实后。

传统备份软件和云服务的结合

一些公司可能会在其所有的备份需求中均使用云备份服务,然而还会有一些公司会倾向于既保留传统备份项目,也使用云备份服务。这其实是两种截然不同的有关将传统备份软件和云备份服务整合的方式。用户既可以选择同时使用传统备份软件和云备份服务,也可以选择使用传统备份软件将数据备份到云存储设备上。

如果考虑使用云备份的初衷是来自便于管理方面,那么就比较方便做出选择。用户可以继续使用传统备份软件来完成大部分的备份过程,之后使用云备份来完成那些最需要的部分。最常用的方法是,在远程站点和笔记本的备份上采取云备份服务。许多公司甚至还没有开始对他们的笔记本电脑开始备份,并且用传统的备份软件来备份笔记本电脑甚至会出现问题。大多数公司都会对他们的远程站点进行备份,然而他们通常会使用不太恰当的方法,因为IT人员上的缺乏。在使用云备份服务的环境下,可以同时解决这两方面的问题,而作为用户唯一需要做的就是做一次检查。

使用云存储设备作为传统备份软件的备份目标的选择,从另外一方面考虑,是不太建议的。这并不是说这样做没有好处。这样做有着和选择云备份一样的效果:无人值守,无限制容量等等。另外的好处就是它也可以实现远程备份的自动完成,这也是许多公司目前所被困扰的问题之一。

事实上,当使用云存储设备作为传统备份软件的目标的时候,问题可能比我们所看到的优势更多。

对于云存储来说没有“太多”数据

首先的挑战是传统备份会传送并存储大量的数据。传统的备份系统通常会一周执行一次备份任务,即使备份应用不会对操作系统进行全备份,也会对其所在的应用进行全备份,比如IBM公司的TSM软件。甚至一些公司会选择每天都执行一次全备份。除此之外,所有的传统备份应用都会执行全部文件的增量备份。这就意味着如果备份前后的差异仅仅是一点,也需要对整个文件进行备份。

这些传统的备份方式带来的不仅是网络上大量的数据传输量,并且在存储目标上也有较高的数据存储量。如果存储目标是云备份设备,那么将需要更大的带宽以及相应更高的云存储费用。需要知道的是,正是因为这样的缺陷才会产生现在使用的重复数据删除技术。备份应用每向主存储上备份1GB大小的数据,将会创建20GB空间大小的数据。由此计算,一个10TB容量的数据中心每月将需要支付200TB容量的存储费用。需要注意的是,至本文发稿为止,重复数据删除技术还不能在云存储上得以应用。

除去需要支付给云存储供应商有关磁盘容量以及数据传输相关的费用,确保传输数据时候能有足够的带宽也需要收取相应的费用。如果需要持续的并且定期的将10TB的全备份都传输完成,那么选择云存储服务商将不是一个好的选择。然而,即使用户的备份需求没有这样极端,传统的备份方式还是会让云存储方面的开销不小。

将数据远程存放:优势和劣势

第二个有关云备份服务的极大挑战来自将备份数据存放到远程的站点上。假定你已经解决了将本地数据存放到远程站点的问题,那么如果遇到数据和服务器不在同一位置的情况又将如何处理呢?很明显的是,这将极大程度上对恢复时间点(RTO)的参数有影响。这就意味着任何存放在云存储上的数据将仅仅是一份拷贝而已,换句话说,一旦遇到需要恢复的情况,这些拷贝将不再是传统数据恢复意义上可依赖的拷贝。将云存储设备作为大容量数据恢复的唯一渠道,无疑大大增大了灾难不可避免的可能性。

这一切听起来好像都是为重复数据删除技术所准备的,其实也不尽然。不少的备份软件都可以实现在数据传输之前先进行重复数据删除操作。这可以一定程度上降低用户对前面所描述的有关将数据备份到云存储上的担忧,然而这并不意味着对数据进行恢复操作的时候将会产生更大的便利。因此,之前说的不要将数据仅仅备份到云存储上的道理还是行得通的。

应用程序的备份可以选择云存储

现在有不少公司的软件或者硬件都可以支持备份到云存储上的操作。业界首先声称能支持云备份的公司是Zmanda公司,这是一家提供开源备份程序的商业公司。Amanda企业版3.1能够实现将数据之间备份到Amazon的S3云存储设备上。

CommVault公司的Simpana能够支持将用户数据备份到任何支持REST(表述性状态转移)协议的云服务提供商的设备上。这样用户就可以使用不同的云存储作为CommVault Simpana备份或者归档的目标设备,例如Amazon、Iron Mountain、Microsoft Azure、 Nirvanix 或者Rackspace。对于云存储来说,用归档的方式来保护可能更为合适,因为归档本身不会执行重复的全备份并且它们都是内嵌有基于对象的重复数据删除技术。

EMC公司和赛门铁克公司分别在备份到它们产品的过程中做出了相应的努力。EMC公司的NetWorker产品使用EMC公司的Atoms云存储架构能够将数据备份到各种云服务提供商的存储中;与此同时,赛门铁克公司的Backup Exec也能实现将数据备份到Symantec Protection Network中。

如果用户目前使用的备份应用尚且不支持之间将数据备份到云存储上,那么可以考虑使用Nasuni公司的文件服务器,这款产品可以提供基于NFS或者CIFS协议的NAS网关,从而实现备份到云存储上的过程。任何的备份可以通过NFS或者CIFS协议的挂载就能轻松备份到云存储上。

尽管有来自各个方面的限制,在将备份应用于云存储结合的时候还是建议考虑重复数据删除。不管是EMC公司的NetWorker产品还是Zmanda都没有将重复数据删除技术内嵌到它们的产品中。CommVault公司的Simpana和赛门铁克公司的Backup Exec均能在将备份传输到目的端前先执行重复数据删除操作。Simpana提供的是基于存储介质的重复数据删除技术,也就是说一旦数据被发送给介质代理(media agent)就马上开始执行重复数据删除操作。而对于Backup Exec来说,它所实现的是基于源端的重复数据删除操作,也就是说在数据被传输前先执行重复数据删除操作。基于它们各自的特性,很多用户也愿意将它们作为和云存储的使用结合的一部分。使用IBM TSM备份软件的用户也对Nasuni充满兴趣,因为TSM本身就内嵌有重复数据删除功能。

建议在选择前先做测试

云备份服务可以成为传统备份系统的极大有力补充,尤其是当这些云备份和传统备份有着某种程度上的整合的时候。作为云备份服务,将几乎不再需要在本地做任何硬件上的部署,因此对于在概念验证(PoC)中使用真实数据来完成测试也相对容易一些。这一点尤其的重要,因为实施本身可能需要通过大量的投资来决定购买多大的许可,这也对用户的备份环境有着不小的影响。本质上说,对于任何的备份产品或者服务,我们都应该做好充分的测试过程。