虚拟化将人们的焦点重新集中到管理效率和高效使用宝贵的计算机资源上来,但随着物理服务器托管的虚拟机(VM)越来越多,IT管理员面临一系列新的数据保护和备份挑战,现在再也不是简单地拷贝重要的数据文件就算备份,每个VM的状态都需要得到保护,并保持随时可访问。
实施虚拟化基础设施后,每个组织都应该重新评估备份需求,选择最合适的技术提供最佳的数据保护。虚拟服务器的备份需求和传统的非虚拟服务器基本上是一样的,备份都是为了防范因硬件、操作系统、软件或人为错误故障引起的数据丢失。但虚拟环境中的备份需求也有其特殊性,备份策略不可能完全照搬以前的方法。
传统备份和虚拟环境备份
首先,虚拟化基础设施通常需要争夺更多的数据,越多的应用程序产生的文件越多,越大,每个VM本身也是一个大文件,如VMware的.vmdk文件,这些文件统统需要保护,由于VM 文件实质上是一个反映了某个时间点VM操作系统状态的服务器内存镜像,因此VM备份会非常频繁。
传统的非虚拟服务器备份过程通常会消耗100%的服务器处理器和I/O资源,备份期间其它进程想要正常运行是非常困难的,虚拟化之后,可能会有10个,20个或更多VM共享服务器的一部分资源,但备份过程是在分配给各个VM的资源范围内进行的,因此不会影响到别的进程。
如果备份单个VM对物理服务器造成过度的资源消耗,其它处于运行中的VM将受到不利影响,从VM备份进行恢复时也要考虑这个问题,每个VM重新上线都会使用一部分服务器资源,留给以后恢复VM的资源就越来越少,因此恢复VM的时间将会越来越长,在设置虚拟环境中的备份策略时,这一点是常常被忽略的。
服务器虚拟化也对存储和网络提出了更高的要求,传统服务器一般使用的是本地存储,但大多数虚拟数据中心都是将虚拟服务器集中存放在共享存储上,如SAN,包括应用程序产生的数据,VM的最新镜像和某些备份,因此,SAN必须能为数十个,甚至数百个VM提供数据交换的能力。
存储和物理服务器之间的网络连接还必须支持由无数独立的VM产生的数据通信,这也是为什么基于IP的SAN,如iSCSI(或NAS)可以满足许多应用场景,但数据中心仍然需要部署独立的高性能光纤通道SAN的原因。
不断增长的数据量,越来越大的服务器计算资源、存储和网络需求,使得备份策略变得越来越复杂,以前创建的备份策略可能已经不能满足当今的需要,组织是时候考虑重新制定或修改备份策略了。
改造现有备份策略,满足虚拟服务器需要
虚拟化并不排斥磁带,那些现在使用磁带备份的企业可以继续使用这些产品,例如,每个VM都作为独立服务器存在,因此给每个VM添加一个磁带代理,将磁带作为VM备份目标就很简单了。
磁带相对更便宜,许多备份工具都支持磁带备份,实际上,那些当前使用磁带进行备份的组织在实施服务器虚拟化时,会继续使用已有的磁带介质。
对于小型或非关键虚拟化部署,磁带已经够用了,但服务器计算资源和网络性能很快就会变得不堪重负,特别是如果多个VM同时备份时情况更糟糕,现在主要的问题是时间。
在备份前,你必须关闭VM,因此在备份期间用户是无法访问该VM的,因计算和网络资源的竞争,VM的备份周期可能变得很长,因此备份VM到传统磁带可能会导致无法接受的长时间备份窗口。
美国科罗拉多州Silverton顾问咨询公司的总裁和创始人Ray Lucchesi说:"备份期间会占用大量的网络带宽,存储带宽和吞吐量,因此,你不应该在上午8点到下午5点这个业务高峰时段执行备份,否则会造成业务系统性能急剧降低"。
遗憾的是,目前还没有什么有效的办法能减轻直接磁带备份架构的不利因素,最常见的用于提高性能的方法是使用磁盘存储,虚拟磁带库(Virtual tape library,VTL)技术也是一种途径,备份软件通过模拟一个磁带系统,将数据备份到磁盘存储上,磁盘存储目标可以是SAN或NAS存储子系统,磁带驱动器通常会创建第二个VTL备份副本。大多数采用虚拟化技术的组织现在终于迎来了一个新的基于磁盘的数据保护解决方案,降低了磁带作为长远或归档存储角色的重要性。
新的虚拟服务器备份策略
在之前《传统备份与虚拟环境备份的区别》这篇文章中,我们分析了改变虚拟环境备份策略的必要性,本文将主要介绍具体的虚拟机备份策略。
虚拟服务器备份的主要挑战是缩短备份窗口,并将网络流量控制在合理的水平,虚拟化技术可以结合SAN提供强大的备份解决方案。
对虚拟服务器而言,最常用的基于磁盘的数据保护技术是快照,顾名思义,快照就是VM文件在特定时间点保存到高性能存储(如光纤通道SAN)上的副本,因为快照可以在几分钟或更短时间内完成,应用程序中断的时间也就短了。
在许多情况下,用户甚至没有意识到已经发生了快照,快照可以捕捉整个虚拟机,也可以是增量的,即只收集发生变化的部分,当虚拟机快照保存到存储上之后,就可以有多种用途了,可以复制或镜像到远程灾难恢复设施,也可以克隆到其它服务器,甚至可以复制到专用备份服务器,最后将其转移到磁带上保存,如VMware统一备份(VMware Consolidated Backup)。
快照也需要加以管理,每个快照都需要存储空间,因此使用快照时,存储监测和容量规划可以发挥很好的作用,此外,你可能只会存储数量有限的快照,因此一定要配置快照工具删除太旧的快照,腾出存储空间给新的快照使用,执行全虚拟机快照后,要及时清除数据缓冲区,否则有可能会导致虚拟机状态不一致,或虚拟机文件被损坏,进一步致使恢复难度加大。
和快照相似的技术是持续数据保护(CDP),它跟踪并记录数据集的任何变化,如虚拟机的状态,虽然你可以频繁地执行快照,但CDP更适合不断变化的虚拟机,CDP的连续性减少了清空缓冲区的需要,但仍然需要管理存储消耗。
物理服务器之间的VM实时迁移显然不属于备份解决方案,但它可以影响数据的保护行为,管理员必须将其考虑进去,虽然VM可以根据需要进行迁移,它们必须要能够访问数据,应用程序也要知道虚拟机迁移到哪里去了。
许多时候,为了适应虚拟机迁移,数据文件也要移动,管理员必须考虑迁移和快照、复制、备份和其它数据转移工具的互动。
还有另一个麻烦需要考虑,VM通常驻留在虚拟平台– Hypervisor之上的,这意味着底层系统平台也需要备份,通常包括一个操作系统和Hypervisor,如Vmware ESX,Citrix Xen或Microsoft Hyper-V。
明尼苏达州The Server and StorageIO集团创始人和高级分析师Greg Schulz说:"虚拟服务器备份需要考虑恢复客户机和整个系统"。
任何备份策略或策略变更都应该包含备份测试,在虚拟环境中,测试基于磁盘的备份通常比测试传统的磁带备份要简单,快照和CDP文件可以快速恢复到空闲服务器,不会对生产环境造成任何影响,这使得培训IT人员和做演示都变得更容易了。
更有效的备份策略
今天的数据保护技术比传统的磁带系统更灵活,正如你前面看到的,每个虚拟机的快照可以在几分钟内采集完毕,如果是增量采集可能只需要几秒钟,不会对生产环境造成影响。
在存储系统方面可以考虑使用重复数据删除技术,VM文件包含大量的空置空间和冗余数据,例如,如果你在10台服务器上运行有50个虚拟机,宿主服务器和客户端运行的操作系统可能是相同的,可以消除重复数据,大大减少快照需要的存储空间,更小的数据集意味着备份到其它介质,或复制到远程站点的速度更快。
不管怎样,数据保护总是需要一些存储空间和网络带宽的,因此应尽量错开VM快照调度时间,例如,如果一台物理服务器托管了10个虚拟机,同时对10个虚拟机执行快照可能不是个好主意,同时对一个或两个虚拟机执行快照可能比较合理,这样存储和网络I/O的高峰值就可以得到有效控制。
最后,虚拟化用户采用多种数据保护方案是很常见的,根据每个VM对组织的重要性采取不同的方案,例如,CDP可以用于保护关键任务虚拟机,普通的虚拟机只需要每小时执行一次快照即可,非关键的虚拟机每天只快照几次便可以了。所有特定时间点的数据都可以定期复制到灾难恢复站点,或其它备份介质,如VTL或磁带。管理员应该根据每个虚拟机的特殊情况制定合理的备份策略。