如何保护Vmware数据恢复与业务连续性

VMware Infrastructure 3 是适合 x86 平台的一种最为先进和常用的企业服务器虚拟化系统。当企业更深地认识服务器虚拟化以及虚拟化带来的种种可能后,他们开始研究向另一虚拟服务器复制的方式,相比使用传统单独物理服务器进行灾难恢复和确保高可用性,这种替代方案更为简便且成本更低。虚拟化实现的可移动能力消除了硬件兼容性问题,大大简化了所复制虚拟机的恢复。

但是,虚拟机至虚拟机 (V2V) 的灾难恢复仍存在复杂性。在恢复站点协调存储卷与虚拟机之间的关联是一项非常复杂且很容易出错的人工任务。而且,简单复制虚拟服务器仅提供“崩溃一致性”磁盘映像,与系统突然发生断电时的映像类似。执行快照和复制包含多个虚拟磁盘的 LUN 时,若不清楚这些磁盘所支持的操作系统和应用程序且得不到其协作,可能导致文件系统不一致以及数据库和其他应用程序中丧失应用完整性。这使得恢复工作非常困难而艰巨,因为系统管理员必须执行一致性检查,有时甚至要重构整个系统。

为简化这一流程,VMware 推出了VMware 站点恢复管理器 (SRM),这是一种适用于VMware基础结构的灾难恢复管理和自动化解决方案。VMware SRM能简化和自动执行恢复流程,在各站点间维持虚拟机与存储之间的协调。

虚拟基础架构与灾难恢复挑战

尽管VMware SRM消除了 V2V 灾难恢复的管理难题,仍然有一些重要的数据一致性问题亟待解决。实现 VMware Infrastructure 3 的许多出色功能需要一个共享存储基础结构,通常是SAN。在一个或多个联网的存储阵列上整合虚拟服务器能将包含虚拟服务器的LUN复制到远程站点的虚拟基础结构,从而简化灾难恢复并降低灾难恢复成本,实现业务连续性。

在图 1 中,复制到DR站点的虚拟服务器磁盘处于崩溃一致性状态。服务器很有可能启动;但是由于没有在应用程序停顿(即无数据写入磁盘的状态)或文件系统缓存刷新的情况下执行了快照,文件系统和应用程序可能损坏。要将这些服务器恢复为运行状态,通常需要进行文件系统和数据库一致性检查,导入事务日志,有些情况下还需要重构应用程序。

为确保使用复制对虚拟机进行的灾难恢复一致可行,企业必须采取一种方法来协调与存储复制并发的所有应用程序和文件系统的停顿。

可以为单个物理服务器上阵列与支持的应用程序之间的协调编写脚本,但这不是一项普通或简单的工作。操作系统中的复制代理可简化这一工作;但是,大多数阵列复制代理都无法感知虚拟。在多台虚拟服务器共享一个或多个 LUN 的虚拟环境中,情况则更为复杂。协调所有虚拟机及其应用程序与快照流程并发的停顿比较困难,并可能导致应用程序停机,因为磁盘 I/O 需暂停以等待受影响的虚拟机完成复制或重新应用恢复日志。

如果在具有多种潜在磁盘配置的情况下,企业选择集成系统和应用程序以停顿应用程序并刷新文件系统缓存,则需要一个全面的系统来管理虚拟机的协调和复制,以扩展 VMware 技术的内置功能。为满足这些需求,飞康针对虚拟基础结构开发了一个简化、整合的 DR 自动化解决方案。

飞康解决方案

FalconStor Application Snapshot Director (ASD) for VMware 能协调飞康NSS设备与虚拟机上的应用感知的飞康快照代理,以提供一种集成的解决方案,用于向远程站点进行不间断复制,并保证完整的事务与文件系统完整性。

可以为多种虚拟基础结构存储配置进行复制配置。为便于管理,可以将多个虚拟机归入一个虚拟文件系统。要执行文件系统的快照,必须先停顿每个虚拟机,然后执行虚拟文件系统所在的基础磁盘的快照。

对于 I/O 性能至关重要的虚拟机,可以使用物理兼容性模式的 VMware ESX 裸磁盘映射 (RDM) 并将其映射至 VMware ESX Server 3.5 控制台以及直接映射至客户操作系统,以此构建理想配置。通过物理兼容性,RDM 能确保客户操作系统能以几乎与物理服务器完全相同的方式配置和复制。

在这种配置下,飞康NSS可以通知虚拟机中的快照代理停顿应用程序并刷新文件系统缓存转入RDM磁盘,以便作好快照准备,从而确保文件系统一致性。然后再将快照复制到另一台远程飞康NSS设备,提供已知良好的时间点上环境的事务一致性映像。

也可以在本地或远程机器上作为飞康TimeView? 映像加载快照,飞康TimeView映像能原样捕获执行快照时的基础卷。然后再利用现有备份软件备份这些 TimeView 映像,将备份处理负载完全从生产系统中转移出来。这是对 VMware Infra-structure 3 功能的一项重要增强–VMware Infra-structure 3 目前只能一次处理一个虚拟机。

全面开放的灵活性与 WAN成本节约

典型的企业解决方案包括一个集群主站点和一个单节点 DR 站点。对于大型企业,可以在商用 x86 硬件上使用飞康技术来实现,一般是在主站点使用光纤通道 (FC) 磁盘存储,在DR站点使用低成本存储,如SATA。在这种情形下,存储容量没有限制,每个虚拟化 LUN 支持多达 255 个快照。FalconStor ASD for VMware 按节点颁发许可证,复制过程包括 WAN 数据加密。

由于飞康NSS可以利用任何磁盘阵列,用户可以同时在主站点和恢复站点上灵活部署最适合自己成本与性能需求的存储,而不必受限于特定磁盘类型。

灾难恢复涉及的一个最大挑战就是带宽的持续成本。保持数万亿字节的数据中心同步将消耗大量WAN容量,因此DR计划也往往受限,无法纳入许多应用程序,因为预算无法涵盖所有这些应用程序。有鉴于此,飞康通过其专利飞康MicroScan?技术提供精简复制,能利用尽可能少的带宽传输数据。

飞康MicroScan技术是一种数据重复删除机制,能消除因应用程序和文件系统层效率低下而导致的任何夸大的块级更改,最大程度减少传输的数据量。由此一来,只会传输那些磁盘扇区级(512 字节)的真正更改。这有助于节省带宽和 DR 的相关存储成本。

飞康MicroScan采用的流程比文件系统和磁盘阵列流程更高效。大多数文件系统在文件发生更改时都至少会写入 4KB 或 8KB 的数据,即使更改很小,只是文档中的一个字符。很多复制解决方案随后会通过 WAN 发送整个更新,因为这是它们认为的可发送的“最小”数据量。某些磁盘阵列系统甚至会在更大的跟踪级别进行处理,即使是最小的更改也会传输 16KB 甚至是 32KB 的数据。

而飞康MicroScan则是从磁盘扇区级别监测数据。在这一示例中,如果发生了细微更改,MicroScan 将查看文件系统写入的 4-8KB“新”数据,同时按 512 字节或 1 个磁盘扇区的粒度向下摂查看实际磁盘扇区;这是写入磁盘驱动器的最小数据单位。如果更改只发生在一个扇区内,则只复制 512 字节。(请注意 4KB 是 512 字节的 8 倍数据。)通过从最小的磁盘扇区级别跟踪数据更改,MicroScan 最大程度减少了传输的数据,相比主要的基于阵列的复制模式,将 WAN 的利用效率提高到了 8 到 64 倍。

总结

服务器虚拟化越来越普及,大大提高了数据中心的灵活性与效率。一个集中的虚拟化存储基础结构对实现虚拟化的全部优势至关重要。飞康面向VMware的解决方案是VMware Virtual Infrastructure 3 和 VMware SRM 的有力补充,旨在将虚拟存储、虚拟化应用程序以及虚拟化服务器之间的多功能性、集成与协调提升到一个前所未有的高度。为此,飞康解决方案为VMware存储实现了完全一致的可靠复制以及快速、安全的恢复,确保流程无中断和业务连续性。