EMC Avamar:为软件定义数据中心而生

保护软件定义数据中心

随着越来越多的数据和应用被转移到由虚拟化软件定义的IT环境中,数据中心的管理难度越来越大。而CIO们现在还要考虑如何根据公司的要求,建立一个可以满足不确定需求水平扩展的需求和为不能精确规划的浮动条件提供服务保证的IT架构,这无疑是火上浇油。不过EMC Avamar似乎在这一方面表现不错,为了进一步了解EMC Avamar如何在统一数据保护解决方案中,为物理系统和虚拟系统提供高效率,高性能的服务,我们将在VMware vSphere 5.1的环境中进行一系列备份和恢复测试。我们将采用EMC系统和Avamar 6.1,并将测试结果和CommVault Simpana 9及赛门铁克NetBackup 7.5.0.4表现做比较。

对于CIO们来说,公司各部门之间有一种趋势,就是把存储“复制数据”当作一种内部方式来满足本地数据备份和保护的需求,这样,数据保护就变得更加复杂。“复制数据”问题不断发展,会让那些考虑企业如何运营的政府监管机构和企业管理者们感到担忧,而且也不会让那些提供快速恢复服务,但是绝不会从线下本地磁带库中恢复数据的工程师们信服。最后将导致的结果是:公司内部的数据被过分保护,大量二级副本被广泛存储。

最近一份关于数据复制市场情况的IDC研究报告使人们开始意识到这个问题的严重性。报告指出,企业数据增长有很大一部分原因是数据被过度复制,在企业新增的数据中,来自于文件数据中的数据只有25%是新的,而块数据中的新数据还不到5%。不仅如此,虽然IDC发现大部分文件只有几个副本,但是仍然有一些文件有最高达100个副本,而且这样的现象并不少见。

对于CIO们而言,目前面临的直接挑战是如何应对这种混乱的环境,以最优的方式处理爆炸式增长的数据量。他们最终要达到的目的是,减少“复制数据”的增长,同时又要提供一种集中式数据保护方式,以便公司的所有部门都能接受并作为它们自己的内部模式。CIO们也希望能为公司管理者提供高度可视化服务水平协议(SLAs)以保证公司业务连续性。更重要的是,如果企业不再为业务连续性担心,那IT部门和公司其它部门在处理“数据复制”的问题上合作起来会更容易,效果也更好。

越来越多的CIO们想找到应对这种问题的解决方案,想找到向以软件定义,以基于监管程序的虚拟化架构为特征的私有云过渡的范例。虽然虚拟架构可以提供技术来优化物理服务器资源,但是它的数据保护方式却是非常复杂,在虚拟机和物理机需要单独备份数据和应用时,工作的效率很低。为了解决CIO们虚拟架构数据保护难题,EMC Avamar为IT管理者提供了一个智能统一的解决方案,用于解决物理机和虚拟机上爆炸式数据复制的问题。

应用程序特定插件

为了解决饱受复杂的备份和恢复操作的IT管理员的问题,EMC Avamar可以横跨多个运行在客户机上的操作系统,为一系列企业关键应用推出了特定平台代理。Avamar代理能和Avamar数据库交流并利用多个软件插件为文件系统和业务关键型应用提供特定功能。

通过这种以插件为中心的智能代理架构,在任何客户机上都能进行重复数据删除,同时减少传送到Avamar数据库中的数据量和被存储的数据量。更重要的是,这种高效率的客户端重复数据删除方式可以横跨多个虚拟机和物理机在全球范围内部署。

在备份过程中,Avamar代理能打破客户端系统文件,把它们分为可变长度的片段,从中识别冗余数据,用一个独特的ID标识一个单独的实例数据。接下来,代理就会联系Avamar数据库确定这个单独实例数据ID是否已经被存储。如果在Avamar数据库中没有发现这个ID,那代理就会压缩传送这个新片段,并用一个新的片段ID来给它归类。否则的话,只会有一个现有ID的链接被传送到片段中每个实例数据上。

与传统方案相比,这种重复数据删除方式单独集中在本地系统上进行,把所有全备份中跟每个系统中含有的片段相同的独特数据段去掉。在Avamar数据去重过程中,一个独特的数据段只被送到服务器一次,不管多少个客户端机中有这个片段。而且,Avamar服务器中有所有的片段元数据,能够完全独立于客户端系统。

在VMware虚拟环境中,Avamar为虚拟机提供两个备份选项,可以串联使用。其中一个选项是利用Avamar进行虚拟机映像的备份和恢复,这样利用一个基于Linux系统的设备作为代理的虚拟机客户端,以便使用VMware vStorage API来进行数据保护(VADP)。另一个选项是直接在虚拟机客户端操作系统上安装Avamar代理。

代理虚拟机客户端采用流行的VMware OVF设备进行映像的备份和恢复操作,借助SCSI热拔插操作来增加任何可以用于ESX主机的数据存储,通过块修改跟踪机制来进一步实现数据转移和容量优化。为了保证备份和恢复管理高效集中,代理虚拟机客户端软件直接和vCenter服务器通信。通过这种方式,Avamar为IT管理者提供恢复整个虚拟机,虚拟机的特定虚拟硬盘或者微软Windows和Linux客户端虚拟机的能力。

与其他企业级数据保护产品不同,Avamar架构具有永久运行基于CBT备份的能力。每个Avamar备份都是全备份。相比之下,CommVault和赛门铁克则需要每隔两周运行一次不支持CBT的综合全备份或全虚拟机备份。

虽然虚拟机密度在最大化虚拟机架构的投资回报中起到关键的支持作用,但是对于CIO们来说,备份的可扩展性更为重要。如果想要一个虚拟架构有较高的回报率,有两个实质因素非常重要,那就是最大化资源利用率,最小化IT管理成本,它们都和主机上的虚拟机密度有一定的关系。增加主机上运行虚拟机的数量能直接提高资源的利用率。但是,如果只增加虚拟机的数量,不增加虚拟机的监控管理程序的数量,还是会影响到虚拟架构应对IT工作负载的效果。最终,无效率的备份扩展会直接为虚拟机密度带来不利影响,降低资源利用率,提高IT管理成本。

在处理灾难恢复和业务连续性问题时,Avamar客户端/服务器方案也有许多优势。业务连续性服务水平协议和以ISO 22301定义的恢复点目标(RPO)和恢复时间目标(RTO),限制了可能的数据损失的可接受量以及从宕机事件中恢复的时长,它们都是非常关键的因素。Avamar方案帮助IT管理者满足它们的要求,积极实现这两个关键因素所要达到的目标。

Avamar用于VMware的代理虚拟机中,利用建立在Avamar客户端和服务器之间的直接联系,支持CBT和重复数据删除,有效地最小化备份窗口。而且,它们之间的联系还能实现真正的客户端数据在全球范围内重复数据删除。借助支持CBT和全球范围数据去重的Avamar代理虚拟机客户端,传送到Avamar备份中的数据量保证最少,而且能最小化备份时间,实现较短的恢复点目标。

每个Avamar代理虚拟机客户端备份都包含CBT元数据,它们也存储在Avamar服务器中,每次复原都用得到。在复原过程中,通过在Avamar客户端和服务器之间建立的联系,客户端和备份服务器能够分析当下的CBT数据,这样客户端在一个复原点进行CBT数据存储时,就能明确确定哪个客户端数据自复原点开始运行以来发生了改变。通过这种方式,Avamar就能只还原自复原点被保存以来发生过改变的数据。

在一种可被看作“增量恢复”的进程中,Avamar基于CBT的复原在恢复操作过程中就能减少上百GB到上百——如果不是上千——MB的数据。更重要的是,当从复原点开始恢复的时候,恢复时间被最小化,恢复过程中转移的数据也最小化,这使得恢复操作非常有效率。这意味着借助Avamar实现的IT解决方案可以提供最优的恢复点目标,并能自动实现最优的恢复时间目标。

性能测试

为了测试Avamar在虚拟架构中的效率和性能,我们建立了三个虚拟机服务器,运行Windows Server 2008 R2。有一个虚拟机服务器被当作主域控制器来配置,运行Active Directory。剩下两个则作为Exchange 2010高可用性群组来配置,使用Database Availability Group(数据库可用性群组 DAG)而非服务器集群来构建。

为了管理VMware虚拟架构进行数据保护的测试,我们采用了两个思科UCS C200服务器,运行ESXi管理程序。每个C200服务器都有两个四核CPU。C200服务器的所有存储都采用了EMC VNX系列5300阵列,采用的是单一磁盘控制器机箱。SAN光纤拓扑采用的是10GbE光纤通道,部署在整合了以太网光纤通道的SAN中。更重要的是,所有的备份任务都是在硬件中立的方式下进行,不会用到VNX阵列任何先进的硬件能力来影响备份性能。

我们采用相同的服务器来测试每个数据保护包。为了能实现像赛门铁克NetBackup和CommVault Simpana数据保护配置中备份服务器和媒体服务器的功能,两个思科UCS C200服务器采用的是10Gbit融合式网络连接。在NetBackup和Simpana服务器处理媒体的配置中,都有一个重复数据删除安装选项。但是在Avamar配置中,只需要Avamar数据存储单一节点以及1Gbit的LAN连接与融合式网络相连。除此之外,Avamar和Simpana配置还包括一个代理虚拟机,使用VMware的SCSI热拔插来备份数据,数据通过LAN连接被转移到媒体服务器或数据存储中。

Avamar虚拟机代理客户端作为一个预先配置好的OVF设备,整合了2个虚拟核心和2GB的RAM。而CommVault虚拟服务器iData代理需要安装到运行Windows server或桌面系统的虚拟机中。

赛门铁克的NetBackup媒体服务器,通过SAN光纤直接进行数据备份。NetBackup所有的备份测试都采用了LAN-free配置,只利用直接的SAN访问虚拟架构硬盘。这样的话,在虚拟机备份过程中,媒体和备份服务器之间大量的网络流量要被认真考虑。

现实世界业务连续性

企业的邮件系统深受IT架构的影响,与电子邮件相关的一系列应用的效率会对整个企业的所有员工的工作有重大影响。这就是为什么企业邮件系统的可扩展性,可靠性,安全性对于IT和公司各部门有深远的影响。于是,我们在运行Exchange 2010的虚拟机上进行了多个细致的备份和恢复测试,来研究备份和恢复操作的效率和性能,以便确定邮件系统业务连续性计划所需要的性能。

每个Exchange DAG(数据库可用组)的配置都是有40GB的系统硬盘和150GB的邮箱数据库。其中一个组被指定为生产活动组。还有一个组中有邮箱数据库的被动副本,用来进行备份和恢复测试。我们使用微软负载生成器工具(LoadGen)在活动服务器上的邮箱数据库中生成一致的可测量邮箱数据。借助生成器,我们很容易就创建了具体的备份和恢复测试场景。

备份测试在虚拟机完全初始化CBT之后进行。在没有CBT的情况下运行一个全备份对于每个应用Avamar的虚拟机来说是一个独特的单次事件,只有使用5.8倍的Avamar硬盘块存储才可以使基于CBT的备份成为全备份。在传统的有独特的全备份和增量备份文件的备份架构中,人们还需要进行没有CBT的周期性备份和综合全备份。

在任何涉及大量数据的备份中,比如说初始全备份,基于SAN的虚拟机备份相对于利用设备的备份有独特的优势,它依赖于VMware的SCSI热拔插访问数据虚拟机的逻辑硬盘进行备份。在SCSI热拔插环境中,备份数据必须要穿过设备的SCSI和网络协议栈,不过不用穿过监管程序的SAN栈,然后才能到达备份服务器。对于同时支持基于SAN和基于设备的备份解决方案来说,采用基于SAN的虚拟机备份方式处理大量数据在一般情况下速度要快上两倍。

即便是这样,虽然运行Exchange的虚拟机初始备份有固有的拓扑优势,但是赛门铁克的NetBackup在备份时间上还是比Avamar少11%,这是一个显著的优势。不过在邮箱数据库中的数据改变了2%之后,再进行虚拟机基于CBT的备份,Avamar的速度就变成了NetBackup的4.8倍,Simpana的3倍。

若赛门铁克NetBackup通过SAN来转移所有的备份数据,那会在LAN网络中出现大量的数据流量。最终的结果就是,LAN网络效率成为影响NetBackup整体性能的重要因素。

备份进程的网络效率可以用备份过程中的平均网络吞吐量来表示。特别是那些低于平均吞吐量的领域,可以用来来判定工作的性能,这和在备份过程中通过转移的数据量来判断性能是一样的。

若采用这种衡量标准,CommVault Simpana通过LAN传输的数据量是Avamar的1.44倍。而赛门铁克NetBackup的总数据流量却相当于Avamar传输的总备份和总数据流量的53倍。

除了为虚拟机建立的CBT元数据以外,另有2%的数据——大概是3GB——被加入到Exchange邮箱数据库中。基于CBT的备份会成为大部分站点的主要备份形式,将会运行在每个备份方案之中。

当Avamar的虚拟机客户端代理在Avamar数据库的配合下进行全球范围内重复数据删除时,Avamar的效率优势就凸显出来了。它能减少使用VMware CBT所需要的总数据量,使传送到Avamar数据库中的数据少于500MB。相比之下,使用Simpana的基于CBT的备份耗时10分钟,而使用NetBackup的基于CBT的备份则耗时14.5分钟。

对于IT管理者来说,更重要的是,VMware的CBT使得创建一个快速基于块的增量备份制度变得相对简单,而且比传统的基于文件的增量备份更有效率。通过把含有在没有CBT的全备份中产生的数据的备份文件和与基于CBT的备份相关的备份文件以一种有序的集合存储起来,创建一种传统的提前的增量备份链。

这种方法创建了一系列连续的复原点与全备份和随后的增量备份相匹配。若想要虚拟机从任何一个复原点复原,需要把全备份作为起始点恢复,然后恢复基于CBT的增量备份,这样才能获得需要的复原点。高级数据保护解决方案能够自动进行这个进程。

打破增量链

对于IT管理者来说,在存储的增量备份链业务中,有一个明显的可靠性问题:在这个存储链中,要是有损坏的或被删除文件,那这条链中后来的备份文件就无效了。因此,减小备份链中的一系列增量备份的体积是非常有必要的。

为了解决在维持最低备份窗口时,增量备份的依赖性问题,中端的备份产品会采用被人们称为“持续增量备份功能”的备份计划,它依赖于周期综合性全备份,是一个整合过程而非真正的备份。不需要读取客户端的数据,综合性备份把最后一次全备份——也可能是综合备份和随后进行的增量备份进行整合,建立一个人为创造出来的备份文件,在其中建立新的备份链。

这个新的综合备份是完整的,独立于以前的备份文件,但是,它也能保存毁坏或被删除的文件,这就是为什么大型的企业级IT站点都把综合备份看作是有问题的。考虑到综合备份的可靠性问题,赛门铁克NetBackup和CommVault Simpana都建议每隔两周进行一次不用CBT的全备份以初始化一个新的备份链。虽然这种策略能减少丢失一系列复原点的可能,但是处理每两周一次的备份是非常没有效率的。

在运行Exchange的200GB虚拟机服务器的测试中,不用CBT的全备份平均完成时间为45分钟。在一年的时间里,在这样的虚拟机上进行26次全备份会增加19个小时的备份进程。更糟糕的是,这些过程要在每个虚拟机上都进行一遍。假设全备份被完美分配,那一个运行42个虚拟机的站点每个虚拟机全备份就需要20分钟——这里指一般情况下的虚拟机,运行驱动数据库的应用程序,数据量大概在75GB到100GB之间——这样,每日的备份计划时长就要增加一个小时来处理全备份。最终,IT运营中进行周期性全备份的授权会反过来影响备份的可扩展性,继而影响到整个虚拟化的投资回报率。

Avamar不从基于CBT的备份中创建增量备份文件,因而避免了这个问题。Avamar并不创建一组分离的备份文件,而是创建一个虚拟的块空间来保护系统。在所有备份中,不管是有CBT的支持,还是没有CBT的支持,块中都含有大量的元数据链接,保存在Avamar的全球虚拟空间中。

每个Avamar的备份都可以看作是一个全备份。每次通过Avamar进行恢复操作,每个受保护系统的每个基于CBT的复原点的全系统映像就会在这个虚拟块空间中进行。没有要关闭的增量备份链,不用进行周期性全备份。

在基于CBT的Avamar备份和CommVault及赛门铁克一直宣称是最佳方式的不借助CBT,每隔两周备份一次的测试比较中,两者的备份时间差异巨大。在每隔两周一次的循环中,Avamar连续的基于CBT的备份进程比CommVault Simpana块18.2倍,比赛门铁克NetBackup快23倍。

CIO们在使用虚拟化架构的过程中,想要达到的一个目标就是充分发挥虚拟架构的能力,比如虚拟机快速重启,非破坏性虚拟机迁移,虚拟机克隆,减少宕机带来的影响。这些因素,使高度灵活的虚拟架构成为任何IT部门的必需品,但是只有一个虚拟架构是不够的,不足以解决跟所有棘手的IT问题都密切相关的业务连续性方面最关键的问题:数据恢复。在业务连续性问题上,备份仅仅是一个方面,对于任何CIO而言,重点要考虑的问题在数据恢复上。

虚拟机备份解决方案现在普遍采用基于CBT的备份方式,它能最小化备份时间,支持更短的恢复点目标,能够把那些在电脑停机恢复时可能丢失的数据减少到最小。虽然如此,这种能实现积极恢复点目标的备份方式可能因为延长的恢复进程而被全面否定。快速备份辅以可靠的加速恢复技术来支持积极的恢复时间目标,这在关键业务应用中,是以分钟数来衡量的。

Avamar借助存储在每个虚拟机备份中的CBT元数据来进行基于CBT的恢复,能够在任何恢复点进行虚拟机数据恢复。借助存储在Avamar数据库中的CBT数据和在目标虚拟机中当下的CBT数据,Avamar虚拟机代理客户端和数据库能整合在期望的复原点恢复虚拟机数据的最小块集。这与其它的解决方案形成鲜明的对比,其它的方案需要在复原点转移所有的即时数据。更重要的是,恢复操作用到的所有数据都必须经过监控程序的处理,然后通过以太网连接把所有的数据转移。

在支持积极恢复时间目标方面,Avamar由CBT驱动的恢复操作是其它方案无法比拟的。在Exchange虚拟机的恢复测试中,我们使用负载生成工具对Exchange邮箱数据库做了2%和5%的数据改变,接下来使用基于CBT的备份创建一系列复原点。为了测试恢复能力,我们选了2个复原点。第一个复原点和最近的备份有关,即邮箱数据库中的数据有2%发生变化。另一个复原点则是数据发生了5%的变化。

在实际案例中,Avamar基于CBT的恢复速度比CommVault Simpana和赛门铁克NetBackup的速度快上许多。不必对此感到惊讶,与最近的备份相比,恢复时间的差异特别巨大,因为需要被转移的数据减少,需要计算的数据就变得更加简单。特别要注意的是,由于复原点被最小化,时间和变化率都发生变化,基于CBT恢复的优势被最大化。最终的结果是,IT部门可以实现优化的复原时间目标,仅仅通过Avamar能实现优化复原点目标的备份操作就能实现。

值得一提的是,利用Avamar恢复大部分最近的复原点只需要两分钟时间。CommVault Simpana花费的时间是Avamar的141.5倍,而赛门铁克NetBackup花费的时间是Avamar的27.5倍。对于一个更早的复原点——邮箱数据库中有5%的数据发生变化的时刻——Avamar用了16分钟——是恢复最近复原点时间的8倍。而CommVault Simpana花费的时间是Avamar的19.75倍,赛门铁克NetBackup花费的时间是Avamar的4.06倍。

除了恢复的时间以外,恢复的网络效率也是值得考虑的问题。它是由进行恢复操作进程时的平均网络吞吐量来表示的。特别是那些在曲线以下的区域,从中可以看出备份过程的网络性能表现,除此之外,进程中转移的数据量也能作为参考标准。采用这种网络效率参考标准,赛门铁克NetBackup通过LAN传输的数据量是Avamar的52倍,而CommVault Simpana传输的数据量则是Avamar的410.8倍。

用户价值

对于CIO们来说,首先要考虑的事情就是如何缩减IT运营的成本。而存储在IT运营成本中占了很大的一部分,所有的存储管理功能都值得认真考虑。而且,公司主管们对业务连续性的担忧也在驱使着下一代IT项目的发展。在一个24x7x365的环境中,计算机宕机带来的损失要远远大于销售和市场的损失。若是计算机宕机,会使客户对公司的信心大大降低,市场份额受到影响,管理者们对IT的要求也在不断提高,复原时间目标以分钟来衡量,复原点目标以小时而不是天来衡量。

Avamar不会从基于CBT的备份中创建增量备份文件。也不会存储零散的备份文件,而是创建一个全球块空间来保护系统。最终实现的结果是,在每次系统保护建立复原点的时候,在虚拟块空间里就可以进行全系统映像备份。

而且,Avamar会收集每个备份中的CBT元数据,在逻辑卷恢复操作中能最小化数据总量。它不仅仅是在选中的复原点上恢复所有与卷相关的数据,而是把虚拟机代理上的即时CBT数据和与复原点相关的元数据进行比较,以便在复原点确定需要改变的数据使虚拟机回到它原有的状态。

借助Avamar,IT部门可以利用基于CBT的备份来实现频繁的自动化备份,获得最小间隔的复原点,来保护关键任务系统。反过来,这种策略又能最小化复原过程中需要传输的数据量。最后一句话总结,Avamar提供的IT策略可以使复原点目标达到最优,同时也能使复原时间目标达到最优。