有“容”乃大,遇“灾”则刚--VERITAS指点“容灾”之路

    在企业里,信息系统承载着企业的业务系统,是企业生存的命脉。国际调查机构Gartner的报告令人警醒,据统计表明:以往在经历火灾、水患、地震等大型灾难而导致系统停运的公司中有2/5再也没有能力恢复运营,剩下的公司中也有1/3在两年内破产。显然,对于现代企业,尤其是大型企业的关键业务而言,“容灾”已到了刻不容缓的地步。


    实际上,现在仍有很多人把“企业容灾”看作是“锦上添花”、“可有可无”、甚至是“杞人忧天”的事情。还有另外一些人,仍然停留在过去搭建一个“容灾”系统的成本过于昂贵的印象当中,这也令不少已然认识到其重要性的企业望而却步,对他们而言,“容灾”系统的高额成本仍是一场“有钱人的游戏”。现在,已经到了走出这些误区的时候了。
  
    “容灾”,软、硬件好比“灵与肉”
  
    通常,打造“容灾”系统大致可从软件和硬件两个方面来考虑。硬件体系主要指“容灾”系统的物理架构,如存储设备和服务器等,这是“容灾”系统的载体,离开硬件架构,“容灾”系统则无从谈起;而对“容灾”系统资源的利用和管理,则必须通过软件来实现,它们是实现“容灾”系统可用性的关键部分。如果把硬件架构比作“容灾”系统的“肉体”,那么“容灾”软件就是“容灾”系统的“灵魂”。在该领域中,VERITAS是专注于“软件容灾”的老牌企业,对此有颇为独到的见解。


    值得注意的是,在VERITAS的“软件容灾”解决方案中,VERITAS选择利用目标恢复时间(RTO)和目标恢复点(RPO)两个指标来衡量“容灾”的等级。显然,通过预先定义RTO和RPO彻底解决了“哪个应用系统是容灾对象”、“可接受的数据丢失率”以及“选用什么方法来实现容灾”的问题,这些都是“容灾”系统首先要确定的前提。
   
    在VERITAS的“软件容灾”理论体系中,VERITAS认为“容灾”系统中的软件必须承担起最基本的四大职责,即掌管启动、关闭、监控、故障切换的应用系统管理职责;负责确定应用的停止及如何响应的故障通知职责;担当在灾备中心随时提供最新有效数据而无需从磁带上恢复的数据迁移职责;以及控制客户端从生产中心重新定向到灾备中心的子网故障切换职责。
  
    “容灾”也分三六九等
  
    应该看到,业界对于“容灾”的需求层次不尽相同。对于电信、金融等领域的大型企业而言,“容灾”要做到“瞬间起效”,绝对不能让突如其来的灾难影响企业业务的运营,哪怕一分一秒也不能中断。另一方面,很多中小企业同样需要“容灾”方案,但他们对于“容灾”系统性能的要求却远没有大企业那么高。可见,“容灾”也要按需求分个“三六九等”。在这一领域,VERITAS软件公司经过多年的发展,已形成了一套比较完善的“软件容灾”方法论,其特色恰好在于将“容灾”分级而制。
  
    大体而言,“容灾”体系可划分为数据容灾与应用容灾两个层次。数据级的“容灾”较为基础,其还可继续细分为两个级别,基础的“数据容灾”方案仅需利用磁带库和管理软件就能实现数据异地备份,达到“容灾”的功效;而较高级的“数据容灾”方案则是依靠数据复制工具,例如VERITAS的VVR软件,或者存储系统的硬件控制器,实现数据的远程复制。相比之下,较高级别的应用“容灾”系统,则要求企业的多种应用在灾难发生时进行快速切换,以确保业务的连续性。应用级的“容灾”系统又包括“手动切换”和“自动切换”两种方式,其中能实现应用自动切换以及瞬间恢复的“容灾”方案是目前“容灾”的最高境界,但其要求的软硬件投入相对较高,因此,享受这种方案的目前主要是电信、金融等领域的一些大型企业。可见,企业应该可以根据自身的需要来构建自己的容灾系统。
  
    软件容灾,弹性部署:“容灾”也能丰俭由人?
    一切企业生产系统出乎预料地失效都应算作是启动“容灾”系统的外界条件,这意味着任何在本地的硬件或软件的失败也都应包括在内。为能使企业在灾难发生时实时、自动地响应,并能在冗余设备上快速将应用系统重新启动而只损失极少的数据,VERITAS提出了构建在高可用性基础平台上的“软件容灾”的概念。
  
    与其他的“容灾”方案有所不同,VERITAS“软件容灾”之道的最大特色就是“可进可退”、“丰俭由人”,为不同需求的用户提供由低到高不同服务等级的“容灾”方案,其中包括从入门级的可管理磁带容灾方案VERITAS NetBackup Vault Option,到较高级的实时数据容灾方案VERITAS Volume Replicator,乃至更高级的企业级的实时应用级容灾方案VERITAS Global Cluster Option和VERITAS Cluster Server。这样,不仅可以满足大型企业的容灾需要,也降低了中小企业迈进容灾的门槛。
  
    必不可少的“灾难演习”
  
    如同高层大厦必须定期进行“防火演习”一样,“容灾”系统也需要进行“灾难演习”,这也是VERITAS的“软件容灾”所独有的特色。由于IT系统的环境很可能需要经常变化,这要求容灾系统也应及时适应这种变化,因此策略性的“灾难演习”成为必不可少的手段。
  
    为了确保企业新搭建的“容灾”系统能在遇到“灾难”的时候及时响应,正常地发挥“四大职责”,VERITAS专门在自己的“容灾”方案中引入了远比单纯的“硬件演习”更节约成本、更方便和拥有更强可用性的软件“灾难演习”功能。由于VERITAS的“灾难演习”对正常运行的生产系统的影响微乎其微,因此它更受需要经常对IT系统进行升级或调整的用户的青睐。
  
    尾声:走向服务的“容灾”
  
    近年来,越来越多的存储服务提供商正在努力尝试这种更新的服务策略,而VERITAS提供的不同服务等级的“容灾”产品和技术,将有助于存储服务提供商开展更广阔的“容灾外包”服务业务。
  
    这种“容灾服务”也可分为“公”、“私”两类,即企业的信息部门为企业内部提供的服务(“私”)以及诸如IDC等机构面向社会市场提供的外包服务(“公”)。由于外包服务商,尤其是面向“公”的服务商,往往需要帮助客户解决存在于结构复杂的异构平台的各种“容灾”问题,因此,他们更加需要利用VERITAS提供的弹性多级的“容灾服务”方案去巧妙解决客户复杂多变的需求。