EMC Avamar:为软件定义数据中心而生
王振 发表于:13年07月23日 10:49 [编译] DOIT.com.cn
保护软件定义数据中心
随着越来越多的数据和应用被转移到由虚拟化软件定义的IT环境中,数据中心的管理难度越来越大。而CIO们现在还要考虑如何根据公司的要求,建立一个可以满足不确定需求水平扩展的需求和为不能精确规划的浮动条件提供服务保证的IT架构,这无疑是火上浇油。不过EMC Avamar似乎在这一方面表现不错,为了进一步了解EMC Avamar如何在统一数据保护解决方案中,为物理系统和虚拟系统提供高效率,高性能的服务,我们将在VMware vSphere 5.1的环境中进行一系列备份和恢复测试。我们将采用EMC系统和Avamar 6.1,并将测试结果和CommVault Simpana 9及赛门铁克NetBackup 7.5.0.4表现做比较。
对于CIO们来说,公司各部门之间有一种趋势,就是把存储“复制数据”当作一种内部方式来满足本地数据备份和保护的需求,这样,数据保护就变得更加复杂。“复制数据”问题不断发展,会让那些考虑企业如何运营的政府监管机构和企业管理者们感到担忧,而且也不会让那些提供快速恢复服务,但是绝不会从线下本地磁带库中恢复数据的工程师们信服。最后将导致的结果是:公司内部的数据被过分保护,大量二级副本被广泛存储。
最近一份关于数据复制市场情况的IDC研究报告使人们开始意识到这个问题的严重性。报告指出,企业数据增长有很大一部分原因是数据被过度复制,在企业新增的数据中,来自于文件数据中的数据只有25%是新的,而块数据中的新数据还不到5%。不仅如此,虽然IDC发现大部分文件只有几个副本,但是仍然有一些文件有最高达100个副本,而且这样的现象并不少见。
对于CIO们而言,目前面临的直接挑战是如何应对这种混乱的环境,以最优的方式处理爆炸式增长的数据量。他们最终要达到的目的是,减少“复制数据”的增长,同时又要提供一种集中式数据保护方式,以便公司的所有部门都能接受并作为它们自己的内部模式。CIO们也希望能为公司管理者提供高度可视化服务水平协议(SLAs)以保证公司业务连续性。更重要的是,如果企业不再为业务连续性担心,那IT部门和公司其它部门在处理“数据复制”的问题上合作起来会更容易,效果也更好。
越来越多的CIO们想找到应对这种问题的解决方案,想找到向以软件定义,以基于监管程序的虚拟化架构为特征的私有云过渡的范例。虽然虚拟架构可以提供技术来优化物理服务器资源,但是它的数据保护方式却是非常复杂,在虚拟机和物理机需要单独备份数据和应用时,工作的效率很低。为了解决CIO们虚拟架构数据保护难题,EMC Avamar为IT管理者提供了一个智能统一的解决方案,用于解决物理机和虚拟机上爆炸式数据复制的问题。
应用程序特定插件
为了解决饱受复杂的备份和恢复操作的IT管理员的问题,EMC Avamar可以横跨多个运行在客户机上的操作系统,为一系列企业关键应用推出了特定平台代理。Avamar代理能和Avamar数据库交流并利用多个软件插件为文件系统和业务关键型应用提供特定功能。
通过这种以插件为中心的智能代理架构,在任何客户机上都能进行重复数据删除,同时减少传送到Avamar数据库中的数据量和被存储的数据量。更重要的是,这种高效率的客户端重复数据删除方式可以横跨多个虚拟机和物理机在全球范围内部署。
在备份过程中,Avamar代理能打破客户端系统文件,把它们分为可变长度的片段,从中识别冗余数据,用一个独特的ID标识一个单独的实例数据。接下来,代理就会联系Avamar数据库确定这个单独实例数据ID是否已经被存储。如果在Avamar数据库中没有发现这个ID,那代理就会压缩传送这个新片段,并用一个新的片段ID来给它归类。否则的话,只会有一个现有ID的链接被传送到片段中每个实例数据上。
与传统方案相比,这种重复数据删除方式单独集中在本地系统上进行,把所有全备份中跟每个系统中含有的片段相同的独特数据段去掉。在Avamar数据去重过程中,一个独特的数据段只被送到服务器一次,不管多少个客户端机中有这个片段。而且,Avamar服务器中有所有的片段元数据,能够完全独立于客户端系统。
在VMware虚拟环境中,Avamar为虚拟机提供两个备份选项,可以串联使用。其中一个选项是利用Avamar进行虚拟机映像的备份和恢复,这样利用一个基于Linux系统的设备作为代理的虚拟机客户端,以便使用VMware vStorage API来进行数据保护(VADP)。另一个选项是直接在虚拟机客户端操作系统上安装Avamar代理。
代理虚拟机客户端采用流行的VMware OVF设备进行映像的备份和恢复操作,借助SCSI热拔插操作来增加任何可以用于ESX主机的数据存储,通过块修改跟踪机制来进一步实现数据转移和容量优化。为了保证备份和恢复管理高效集中,代理虚拟机客户端软件直接和vCenter服务器通信。通过这种方式,Avamar为IT管理者提供恢复整个虚拟机,虚拟机的特定虚拟硬盘或者微软Windows和Linux客户端虚拟机的能力。
与其他企业级数据保护产品不同,Avamar架构具有永久运行基于CBT备份的能力。每个Avamar备份都是全备份。相比之下,CommVault和赛门铁克则需要每隔两周运行一次不支持CBT的综合全备份或全虚拟机备份。
虽然虚拟机密度在最大化虚拟机架构的投资回报中起到关键的支持作用,但是对于CIO们来说,备份的可扩展性更为重要。如果想要一个虚拟架构有较高的回报率,有两个实质因素非常重要,那就是最大化资源利用率,最小化IT管理成本,它们都和主机上的虚拟机密度有一定的关系。增加主机上运行虚拟机的数量能直接提高资源的利用率。但是,如果只增加虚拟机的数量,不增加虚拟机的监控管理程序的数量,还是会影响到虚拟架构应对IT工作负载的效果。最终,无效率的备份扩展会直接为虚拟机密度带来不利影响,降低资源利用率,提高IT管理成本。
在处理灾难恢复和业务连续性问题时,Avamar客户端/服务器方案也有许多优势。业务连续性服务水平协议和以ISO 22301定义的恢复点目标(RPO)和恢复时间目标(RTO),限制了可能的数据损失的可接受量以及从宕机事件中恢复的时长,它们都是非常关键的因素。Avamar方案帮助IT管理者满足它们的要求,积极实现这两个关键因素所要达到的目标。
Avamar用于VMware的代理虚拟机中,利用建立在Avamar客户端和服务器之间的直接联系,支持CBT和重复数据删除,有效地最小化备份窗口。而且,它们之间的联系还能实现真正的客户端数据在全球范围内重复数据删除。借助支持CBT和全球范围数据去重的Avamar代理虚拟机客户端,传送到Avamar备份中的数据量保证最少,而且能最小化备份时间,实现较短的恢复点目标。
每个Avamar代理虚拟机客户端备份都包含CBT元数据,它们也存储在Avamar服务器中,每次复原都用得到。在复原过程中,通过在Avamar客户端和服务器之间建立的联系,客户端和备份服务器能够分析当下的CBT数据,这样客户端在一个复原点进行CBT数据存储时,就能明确确定哪个客户端数据自复原点开始运行以来发生了改变。通过这种方式,Avamar就能只还原自复原点被保存以来发生过改变的数据。
在一种可被看作“增量恢复”的进程中,Avamar基于CBT的复原在恢复操作过程中就能减少上百GB到上百——如果不是上千——MB的数据。更重要的是,当从复原点开始恢复的时候,恢复时间被最小化,恢复过程中转移的数据也最小化,这使得恢复操作非常有效率。这意味着借助Avamar实现的IT解决方案可以提供最优的恢复点目标,并能自动实现最优的恢复时间目标。
性能测试
为了测试Avamar在虚拟架构中的效率和性能,我们建立了三个虚拟机服务器,运行Windows Server 2008 R2。有一个虚拟机服务器被当作主域控制器来配置,运行Active Directory。剩下两个则作为Exchange 2010高可用性群组来配置,使用Database Availability Group(数据库可用性群组 DAG)而非服务器集群来构建。
为了管理VMware虚拟架构进行数据保护的测试,我们采用了两个思科UCS C200服务器,运行ESXi管理程序。每个C200服务器都有两个四核CPU。C200服务器的所有存储都采用了EMC VNX系列5300阵列,采用的是单一磁盘控制器机箱。SAN光纤拓扑采用的是10GbE光纤通道,部署在整合了以太网光纤通道的SAN中。更重要的是,所有的备份任务都是在硬件中立的方式下进行,不会用到VNX阵列任何先进的硬件能力来影响备份性能。