存储解决方案: 存储网络容灾备份方案设计

    随着数据的可用性成为区别企业能力的重要指标,企业正在将越来越多的资源用于确保业务的连续运营。思科提供的先进技术可以帮助企业以一种更加可扩展、更加安全、更加经济的方法,建设端到端的备份和恢复解决方案以及灾难恢复解决方案。
  
    在服务器上存有关键任务型数据的跨国企业需要为它们的应用提供不间断的可用性。为了防止数据受损,这些数据至少应当定期备份到磁带。但是,不断增长的数据容量需要更大的存储容量、更快的服务器,也需要更长的备份时间。用户还必须考虑到,花几个小时进行备份意味着需要用相同的时间来进行恢复。用户往往无法接受这么长的恢复时间,因为它会导致停机时间的延长,从而导致收入的损失。因此,在很多情况下,磁带备份被视为是灾难恢复(DR)计划的最低等级。
  
    为了确保企业应用所需要的99.999%的正常运行时间,存储设计必须在每个级别考虑高可用性因素。所有企业都应制定一个灾难恢复计划,以便在发生大规模中断时无缝地将数据转移到某个备用站点。除了磁带备份以外,企业通常需要在它们的容灾备份计划中,使用复制技术来远程复制整个数据中心。因此,恢复计划现在除了从磁带恢复数据以外,还应当包括在发生故障时将数据中心转移到一个远程地点。灾难可能由多种因素导致,并且很难预测。下面列出了可能导致灾难的主要因素:设备故障、应用故障、人为错误、自然和非自然灾害、 每个企业都必须找出所有需要保存、以实现连续访问的关键性数据,为从灾难中恢复做好充分准备。因此,用户必须进行业务影响和风险分析,以确定对企业最重要的地点、职能或者应用。一个远程数据中心??即主数据中心的镜像,可以用于在发生大规模灾难之后继续提供完整的访问。很多容灾备份解决方案都需要在将数据备份到磁带的同时,保存数据的实时镜像。复制技术还可以提供适用于不同应用需求的选项。尽管复制技术可以帮助一个企业更快地从灾难性故障中恢复,但是它也存在一定的限制,例如它会将受损数据和有效数据一同复制。因此,企业仍然需要进行磁带备份,以存档有效数据。本文着重介绍作为整个容灾备份计划的一个组成部分的磁带备份的技术、架构和选项。
  
    磁带备份
  
    在今天的企业环境中,大多数应用服务器都是通过并行SCSI直接连接到专用的磁带驱动器上。因为需要管理的磁带设备的数量与应用服务器的数量成正比,所以专用资源的部署和维护成本都很高。但是,直接连接的磁带驱动器可以保障性能,因为服务器是唯一使用驱动器的设备。成本因素促使企业转向网络备份模式,即磁带驱动器放置在一个LAN 上,供多个服务器共享。在一个典型的基于LAN的备份模式中,数据和备份流量都会通过相同的LAN传输。这种网络备份模式有助于提高磁带的利用率和可管理性,但是也会带来一些问题,下面将详细介绍这些问题。
  
    首先,需要备份的大量数据会增加LAN 上的流量,导致应用性能的降低。备份通常都在下班之后进行,以便最大限度地减少对应用流量的影响。不断增长的数据量会导致备份时间的延长,有可能需要占用上班时间。随着企业业务的全球化,企业对24×7 正常运行的要求越来越高,可以用于备份的时间也越来越短。其次,让备份和应用流量都通过LAN 传输,就可能会导致备份中断,进而导致备份任务全都失败。第三,备份和数据应用共用同一个LAN 经常会导致很高的成本,因为一个环境的固件升级或者不稳定性可能会导致另外一个环境的中断。为了在一个共同的LAN 中消除这些潜在的冲突,管理员建议将应用和备份隔离开。在较新的部署中,客户正在向无需LAN 的架构转型,以便隔离备份流量和应用,下面将具体介绍这种架构。很多客户已经开始部署专门用于备份的存储网络。
  
    目前部署的备份流程都是手动的,需要投入很多人力,而且经常会遇到因为人为错误而导致的故障。发生故障的备份常常不会被发现,从而导致在故障之后丢失数据。磁带必须手动插入、轮换,并取出运输到异地,以确保可恢复性。因为手动管理的成本很高,企业必须提高自动化水平,即利用自动控制装置加强对磁带的管理。集中备份应用可以将多个磁带组织成磁带池,因而大量备份可以被合并到一个磁带上。当某个磁带装满之后,备份应用会继续使用磁带池中其他未被使用的磁带,从而可以大幅度地提高可管理性。需要管理的磁带驱动器的大幅度减少有助于降低成本。
  
    备份需要增加应用服务器的活动,以便从磁盘获取数据和将其写入磁带。应用服务器通常忙于处理大量对延时和性能非常敏感的数据。数据的移动和调度需要占用额外的CPU 周期,而进行备份通常会对应用本身造成严重的影响。无需服务器的解决方案可在应用服务器本身进行备份时,消除备份对于应用性能的影响。这种架构将移动数据和安排连接的任务交给了一个专门的备份服务器。一个强大的备份解决方案必须解决下列问题:



  • 1. 优化备份资源的使用,包括磁带、驱动器和工作时间;

  • 2.最大限度地降低对应用流量的影响;

  • 3. 隔离备份域,以降低应用服务器的CPU负载。

    下面几节将详细地介绍新出现的几种备份解决方案。
  
    无需LAN的备份
  
    无需LAN 的备份让每个应用服务器都可以通过存储网络,直接将数据移动到某个磁带设备,而不需要经过专门的备份服务器。利用通用的共享存储选项,每个应用服务器都可以充当一个介质服务器,因为它们可以直接将数据发送到磁带。每个服务器确定一个专用的磁带驱动器,并在备份过程中独占该磁带驱动器。用户还可以利用对磁带库中磁带驱动器的专用访问权限对应用服务器进行配置,而不是使用共享选项。经过存储网络传输的数据流有助于减少LAN 流量。一个磁带也可以被多个应用共享,并且可将多个备份流合并到所管理的磁带库和驱动器中。LAN 仍然可以用于在备份服务器和客户端之间传输元数据和用以跟踪数据变化位置的环境表,但是实际的备份数据将通过存储网络传输。无需LAN 的备份可以隔离数据域和备份域,但是不能减轻应用服务器的CPU 负载,因为它们仍然需要从磁盘读取备份数据。下面将要介绍的服务器负担较轻的备份方式可以解决这个问题。
  
    服务器负担较轻的备份
  
    服务器负担较轻(或者无需服务器)的备份需要在数据不经过应用服务器本身的情况下,将备份数据从磁盘发送到磁带。在服务器负担较轻的备份中,对所要备份数据的复制对服务器上的应用影响非常小,或者根本不会造成任何影响。数据的复本随后会智能地从磁盘发送到磁带,而不需要经过服务器。这个流量有助于减轻应用服务器的CPU 负载,因为它并不处于备份数据的传输路径上。直接在磁盘和磁带之间直接传输数据的机制被称为SCSI 扩展复制命令。执行扩展复制SCSI 命令的组件可能位于SAN 交换阵列或者服务器软件中。目前所部署的服务器负担较轻的备份(例如Legato Celestra Power 和Veritas NetBackup)可以通过备份服务器管理整个流程。大部分客户目前都倾向于为备份部署专门的SAN,因为这样有助于隔离数据域和备份域。因此,他们可能不会部署这个解决方案,因为磁盘子系统和磁带驱动器必须位于同一个SAN上。
  
    备份行业和产品概述
  
    软件供应商推出了很多集中备份软件,例如Veritas Netbackup、Veritas BackupExec、Legato Networker和Computer Associates BrightStor ARCserve 2000 高级版。所有这些产品都采用了一种集中机制,备份都是通过一个专用备份服务器和直接连接的存储设备进行。一个集中备份系统可能还需要设计很多不同的软件和硬件模块。用户必须了解备份解决方案的这些不同组件,以及它们的功能和对性能的影响。
  
    首先,中央或者主服务器负责控制整个备份环境,包括索引、备份调度、客户群组定义和硬件配置。主服务器还负责记录备份中的问题,并向系统管理员报告这些问题。这项功能有时被称为连接安排。集中备份系统中的另外一种服务器是介质服务器,也被称为存储节点。介质服务器被连接到某种类型的存储介质上进行备份,通常是通过光纤通道或者并行SCSI 连接到某个磁带设备上。介质服务器负责真正地将数据发送到磁带。这种服务器需要从主服务器获取关于需要备份哪些文件和使用哪些特定介质的信息。介质服务器也被称为数据输送器。第三,也是最重要的组成部分是备份客户端,它实际上指的是被备份的服务器。客户端软件将安装在每个需要备份服务的系统中。即使是主服务器和介质服务器通常也会安装客户端软件,这样它们就可以对自己进行备份。
  
    利用SAN 进行备份的主要优势
  
    如前所述,企业已经开始部署基于专用光纤通道的存储网络,以解决共享LAN 的性能瓶颈问题。存储网络的其他优势包括:
  
    提高数据可用性
  
    存储网络基础设施可以为存储子系统(包括磁盘和磁带)提供多条路径,以提高可用性和可扩展性。客户可以部署经过改进的灾难恢复解决方案,尤其是在开放的系统环境中。在传统部署中,要在一个远程站点进行灾难恢复,通常需要采用LAN 上的服务器间通信。在网络模式中,数据可以在两个存储子系统之间建立镜像连接,而无需使用价格昂贵的服务器和LAN 资源。将备份流量移植到一个存储网络会减少每个域中可能出现的故障,并可以防止备份受到LAN 数据流量的影响,反之亦然。
  
    降低TCO
  
    存储整合让多个服务器可以共享相同的存储设备,减少数据中心所需要的磁带库的数量。整合还让用户可以更加方便地重新分配所有服务器中未被使用的容量,从而提高资源的利用率和使用效率。客户可以部署一个企业级备份/恢复解决方案,以降低由连接到服务器上的磁带驱动器所带来的管理和维护成本,从而节约大量的资金。管理每个组件的成本会因为手动流程中经常出现的人为错误而大大增加。很多机制能减少这些错误,例如远程磁带库,即通过部署自动备份系统,避免在两地间手工运输磁带。由于不需要运输用于恢复的数据,这种机制可以避免由于操作不当而导致的损坏,降低数据流失的可能性,以及提高数据的可用性,从而提高系统的可靠性。存储网络将备份资源整合到一起,供每个服务器使用,同时降低由于某一个备份设备发生故障而造成的影响。整体运营成本(TCO)还可以通过共享备份资源的增强可扩展性、可用性、性能和可管理性而得到大幅度的降低。
  
    灵活的备份选项
  
    现在,很多企业都延长了营业时间,并支持来自全球各地的客户,这推动了全天候运营的备份需求。现有的两种备份选项是热备份和冷备份:冷备份是指在备份期间应用数据停止更新;而热备份是指在系统进行备份的过程中,应用仍然继续更新数据。
  
    热备份技术(例如写时复制和分离镜像快照)利用在某个特定时刻创建的原始数据镜像,在不影响应用正常工作的情况下进行在线备份。写时复制和分离镜像选项都会将数据区块复制到未被使用的存储上,以创建某个时间点的副本,大多数数据库都支持这两种技术。写时复制和分离镜像选项可以管理物理数据区块的映射流程,以及它们与某个文件系统或者数据库的关联。支持这两个选项的存储子系统供应商包括使用业务连续性卷(BCV )的EMC Timefinder,HDS ShadowImage,以及IBM 企业存储服务器(ESS)或者模块化存储服务器(MSS)中的FlashCopy。
  
    备份部署的设计目的是缩短备份所需要的时间,最大限度地减少对用户流量的影响(尤其是对于冷备份)和提高性能。热备份可以利用镜像技术??无论是在本地还是远程,来确保应用的连续可用性。下面将详细地介绍远程镜像技术。
  
    远程数据镜像/数据复制
  
    远程数据镜像(即远程复制)是迅速恢复应用和数据的最常用机制。顾名思义,这种技术是指在磁盘子系统中创建一个镜像卷,以提供保护。应用所使用的数据卷被视为主卷,镜像卷被视为从卷。目前采用的两种主要的远程复制技术是:



  • 1.基于主机的远程复制软件;

  • 2.基于存储控制器的远程复制硬件和固件。

    目前最知名的远程复制工具包括EMC Symmetrix RemoteData Facility(SRDF)、IBM eXtended RemoteCopy (XRC)、IBM的Peer-to-Peer Remote Copy (PPRC)、HDS的TrueCopy、康柏的Data ReplicationManager (DRM)和Veritas Volume Replicator (VVR)。IBM XRC 和Veritas VVR 解决方案都是基于主机、软件辅助的数据镜像工具,而PPRC、SRDF、TrueCopy和CRM 都是基于硬件控制器的远程复制工具。必须要指出的是,Veritas(VVR)通过一个IP 网络,而不是光纤通道和ESCON(企业串行连接)提供远程数据镜像。
  
    思科的灾难恢复产品和解决方案
  
    随着数据的可用性成为区别企业能力的重要指标,企业正在将越来越多的资源用于确保业务的连续运营。如前所述,专用网络可以确保备份应用的性能指标和安全性。智能化存储网络可以为备份和恢复提供一个新的发展方向。此外,远程数据复制解决方案能提供更高的可用性,并通过扩展规模,满足大型企业的需要。思科提供的先进技术可以帮助企业以一种更加可扩展、更加安全、更加经济的方法,建设端到端的备份和恢复解决方案以及灾难恢复解决方案。
  
    Cisco MDS 9000系列多层控制器和光纤通道交换机以大型企业和电信运营商的存储网络环境作为服务对象,可以提供更高的端口密度、交换带宽、性能、多协议功能和可靠性。Cisco MDS 9000系列产品还可以用于综合性存储局域网,这种网络的整个存储环境中包含多个运营商的产品。在这种环境中,Cisco MDS9000系列产品可以充当一个集中系统,提供互联和高级服务。
  
    Cisco MDS 9000系列包括MDS 9500 系列多层控制器和MDS 9216多层光纤通道交换机。Cisco MDS 9000系列产品都是模块化的系统,针对很高的端口密度和数据中心应用的性能进行了优化。对于那些用于备份和灾难恢复的远程数据中心,Cisco MDS 9216多层光纤通道交换机是一款较小的产品,但是所有功能和服务都与MDS 9500系列控制器相同。
  
    除了这些交换设备以外,Cisco MDS 9000系列多层控制器和光纤通道交换机还可以提供多种功能和服务,例如虚拟SAN、高级ISL链路集成、LUN分区、故障通报、高可用性和不中断固件升级。目前,困扰大多数用户的一个难题,是缺乏足够的可管理性和工具来对存储网络提供足够的支持。Cisco MDS 9000系列产品包括一个强大、内嵌交换陈列管理器应用,它可以配置、监控和诊断存储网络。
  
    虚拟SAN(VSAN)
  
    在很多现有的环境中,备份应用解决方案设计需要为备份流量建立一个单独的并行网络。从技术和运营的角度来说,虽然提高了成本,但这个独立的网络会提供一个灵活、安全且高度可用的备份解决方案。磁带存储网络与磁盘存储网络的分离消除了故障(例如磁带库(TLU)的重启)对于应用的影响。这个独立的网络还可以防止由于设备重启导致的备份故障对于应用的影响。因此,这种做法事实上已经成为将磁带设备与磁盘子系统隔离的标准做法。通过这种隔离,交换阵列配置的变化所产生的影响将只限于本地,不会导致系统的中断,从而为独立SAN 的连续部署提供了有力的支持。
  
    尽管这些独立的存储网络可以保障性能和防止整个交换阵列的中断,但是它是一个非常昂贵的解决方案,需要购买独立的交换机,并且增加了管理的复杂性。此外,这种解决方案经常会导致一些端口被废弃,这对于那些部署此解决方案的客户来说可能意味着很大的损失。思科提供的先进技术利用了一种名为虚拟SAN(即VSAN)的功能,改革了存储网络的部署方式。VSAN提供了一种在同一个冗余物理基础设施上建设一个虚拟隔离交换阵列的方法。因此,VSAN可以按照这些设计的要求,保障SAN 域的安全性和独立性。Cisco MDS 9000系列多层控制器和光纤通道交换机能够在同一套物理基础设施中创建多达1024个独立的VSAN拓扑或者结构。这种部署有点类似于以太网中的VLAN。VSAN利用经过验证的技术和以太网在配置上的方便性,在SAN环境中提供了诸如流量隔离和安全等功能,从而彻底地改变了SAN部署的方式。
  
    VSAN利用一些在以太网中得到验证的技术,满足了光纤通道存储的性能和隔离要求,提供了一个业界最佳的解决方案。分区可以在边缘控制访问权限,因而在限制访问权限和交换阵列中不同设备间传输的流量方面非常有用。VSAN所提供的一项补充性的功能是,隔离交换阵列中提供的所有服务,并将它们“封装”到一个VSAN中,从而建立一个逻辑独立的交换阵列。
  
    VSAN创建的存储网络域不仅可以支持现有的安全机制,还可以在多个虚拟环境中隔离一台交换机。不同的VSAN之间可以提供完全的隔离,并确保某一个设备的故障或者交换阵列不稳定性的影响将会只限制于某一个VSAN中,而不是导致整个交换阵列的中断。所有这些都不需要部署那些要使用多个物理隔离的光纤通道交换机的解决方案。VSAN还可以通过最大限度地提高端口利用率和降低每个端口的成本,降低存储网络的TCO。这种部署非常有效,因为多个用户群体可以组织起来,从而让交换阵列基础设施可以用少得多的设备为这些用户提供服务。Cisco MDS 9000系列提供了先进的安全性和服务,同时降低了资本和运营开支。
  
    这种架构不仅可以降低数据中心中部署的SAN或者交换阵列的总数,还可以保持现状,即将备份/恢复和恢复数据交换阵列域与应用SAN隔离开。考虑到数据中心的占地成本和客户所采用的存储整合模式,VSAN可以为企业提供一个TCO 较低的解决方案。



无需LAN的备份模式



服务器负担较轻的备份模式



带有VSAN的分散变换阵列



典型的基于LAN的备份模式



DWDM和FCIP在不同距离上提供远程服务传输