DoSTOR专家观点: Jeremy 自两年前加入 NetApp 以来,就一直专攻远程办公室和数据中心内的数据保护问题。目前,他主要研究数据保护及其与 VMware 相对应的灾难恢复问题。Jeremy 在存储行业工作达 7 年以上,其工作范围包括数据中心环境中的备份、灾难恢复和存储管理。
从物理服务器转变为整合的虚拟化基础设施具有不可否认的 IT 优势。但是,快速迁移到 VMware 使灾难恢复 (DR) 的传统方法过时了,也增加了 DR 实施的复杂性。
用于 VMware® Virtual Infrastructure 3 (VI3) 的 DR 要求您的所有 VM(虚拟机)都需要定期复制到远程站点,从而消耗了大量的存储和网络带宽。通过在 VMware 主存储系统上使用 NetApp 重复数据删除,可以大大减少您的主存储环境中的数据量。数据量的减少会使得您的下游基础设施的优势不断加强,从而减少复制所需的带宽以及 DR 站点上所需的存储。
使用重复数据删除所节约的成本可以使 DR 在成本可能会受到控制的情况下变得切实可行。例如,有个客户曾报告在重复删除其 VMware Virtual Desktop Infrastructure (VDI) 环境之后,为其桌面提供 DR 所需的存储和带宽变得很少了,并且为其 VDI 环境和 VI3 环境添加 DR 切实可行。
在本文中,我将探讨通过 VMware DR 实施重复数据删除所需要采取的措施。我还将讨论利用您的 DR 环境中的复制数据用于 DR 测试及其它目的的情况。
在主 VMware 环境中实施重复数据删除
由于 VMware 环境中的每个虚拟机都要求为其操作系统采用专用的存储,因此会出现大量的重复数据。您可能有很多 VM 安装了同一个操作系统和应用程序。
如果 100 个 VM 运行同一个操作系统,且每个虚拟机需要 10GB 至 20GB 的存储空间,即 1TB 至 2TB 的存储空间专用于同一数据的几乎相同的拷贝。应用 NetApp 重复数据删除可以有效消除此冗余。
概括地说,如果将 X 个虚拟机指定给一个存储卷,在重复数据删除后,您所需的操作系统存储空间量将是非重复数据删除环境下所需存储空间量的 1/X。很显然,所获得的实际结果将取决于卷中有多少个 VM 和这些 VM 相似程度。
实际上,客户在 ESX VI3 环境通常可以节省 50% 或更多的空间,某些情况下存储空间节省可高达 90%。这是对整个 VMware 存储环境(包括应用程序数据,而不仅仅是操作系统)进行重复数据删除。在 VDI 环境下,客户通常可节省高达 90% 的存储空间。
NetApp 重复数据删除的另一个优点是它不仅可以在主存储设备上运行,还可以在任何现有的 NetApp 卷上运行。即使您的 VMware 基础设施建设很完善,也可以运行重复数据删除并节省大量存储空间。只需提供重复数据删除许可证(免费)和目标存储系统上的 NearStore® 许可证即可进行操作。
灾难恢复配置
虽然主存储环境中的存储空间使用量得到减少本身已经是一个重大益处,但是在使用 NetApp SnapMirror® 实施灾难恢复时,从重复数据删除中获得的真正收益更加明显。因为重复数据删除大大减少了必须复制的数据量,从而减少了 DR 位置所需的空间和站点间所需的网络带宽。进行重复数据删除以后,您也许可以配置 DR 以尽可能低的速度进行链接,将更容易和更快速地让您的 DR 环境维持运转。
图 1) 在具有 DR 复制的 VMware 环境应用重复数据删除。
如要配置 DR,首先请在存储数据的主 VMware 存储环境中对所有卷执行重复数据删除。然后在 DR 站点的主卷和目标卷之间创建 SnapMirror 关系。
与许多其他复制解决方案不同,SnapMirror 不要求目标配置与源配置完全一样。如果需要,您可以在 DR 站点中使用不同的 NetApp 存储系统和价格较低的磁盘(如 SATA 磁盘,而不是光纤通道磁盘)。
当 SnapMirror 第一次运行时,它会将每个源卷与其目标卷同步。此过程通常是 SnapMirror 实施时最耗带宽的部分,但是因为源卷都已执行重复数据删除,因此要传输的数据量会比实际量少很多。此方法是以下用户的理想之选:链接速度慢、没有足够带宽执行初始同步但可以管理此后出现的增量更新。
请注意,因为重复数据删除在卷级起作用,所以您必须使用 Volume SnapMirror 来获得最大收益。Volume SnapMirror 在整个卷上执行,因此您的镜像始终与源卷有相同的重复数据删除级别,还可节省空间、减少带宽利用以及加速镜像更新过程。
一旦完成初始同步,您就可以配置 SnapMirror 按计划运行,让 DR 站点内容始终保持最新。在每次迭代时,SnapMirror 仅传送已更改的数据块,因此它能更有效地利用网络带宽。
您将需要在主站点定期运行重复数据删除。根据您的特定需求,可在以下时间运行重复数据删除:
- l 按指定的时间表
- l 卷中有 20% 的新数据时自动运行
- l 在需要时手动运行(例如,在安装大的修补程序以后)
使用 SnapMirror 后,无论主卷上有什么更改,都会自动反映到辅助卷上,因此不需要在您的 DR 站点运行重复数据删除。由于辅助卷是镜像,它们从主卷"继承"重复数据删除状态。
利用 DR 环境
获得 DR 站点的所有数据并通过 SnapMirror 定期更新后,并不意味着事情到此结束。NetApp 还可以利用 DR 站点存储的数据进行 DR 测试、开发或各种其他用途。
图 2) 在 DR 站点利用 FlexClone® 可将复制的数据用于多种用途。
在典型的 DR 测试环境中,在测试开始前必须将用于测试的所有数据复制到另一组磁盘。这意味着您需要两倍的存储空间,并且在开始测试前的复制操作也很耗时间。
借助 NetApp FlexClone 技术,您可以使任意或所有 DR 卷都成为具有空间效益的可写克隆;只在更改克隆卷时才会占用额外的空间。这些 FlexClone 卷便于您及时捕捉 DR 数据在固定时间点的静态视图,而不用中断进行中的 SnapMirror 更新,也不需要大容量的额外存储。
使用 FlexClone,您可以将进行 DR 测试的时间从 24 小时或更长时间降到几个小时,这是因为该过程快速、可靠、高效且无需使用密集资源。也可以通过类似方式对应用程序开发工作、数据挖掘、修补程序测试等使用 FlexClone。
DR 站点代表大量的资源投资。借助 FlexClone,您可以利用这些资源执行其他任务,而不会负面影响 DR 就绪。通过简化 DR 测试,FlexClone 使它更容易符合公司规定的 DR 测试需求以确保 DR 就绪。
总结
将 NetApp 重复数据删除应用到主 VMware 存储会在主基础设施和 DR 基础设施中产生巨大收益。在典型环境中,可以将主存储需求减少 40% 至 60%。此节省模式会将 DR 站点所需的存储以及 DR 所需的带宽减少相应的数量,使 DR 速度更快、更有效率。您可以使用 NetApp FlexClone 来利用 DR 站点的数据进行 DR 测试、应用程序测试/开发或其他活动,以便最大化资源利用。