灾难备份预防到业务连续 技术发展推动容灾普及

    在“9.11”事件之后,人们认识到实施灾难备份的重要性,国内的银行、电信等大型企业陆续开始考虑灾难备份系统的建设工作。而东南亚海啸灾难的发生又进一步推动了国内重要行业灾难恢复系统建设的进程。 
  
    灾难备份并不是一个新的话题,但今年灾难备份却再次成为大家关注的热点。“以前对容灾是谈得多,观望的较多,真正做项目的较少;以前对容灾的关注主要是金融、电信等行业客户,如今政府、企业甚至一些中小企业客户也开始讨论容灾;以前容灾项目主要是对灾难的预防,而现在则主要是出于对业务连续性的考虑。”曾为国内实施众多容灾项目的EMC 大中国区技术解决方案总经理任志辉这样表示。 “今年是灾难备份市场快速起步的一年,从金融、电信到政府、社保、税务等都在规划和讨论容灾项目,灾备市场进入了快速发展的阶段。” 
  
    从探索到实践 
  
    “中国的灾备建设在经历几年的探讨后,正逐步进入实践阶段。”促成容灾备份市场快速发展的原因主要源于两个方面:客观上是国内信息化建设的不断完善和普及,很多政府、行业和企业的关键业务系统已经全部信息化,而保持业务运行的连续性和信息的安全已成为他们首要考虑因素;另一方面,则是今年政府对国家重要行业灾备建设的推动,正是因为东南亚海啸灾难的发生,国务院信息化办公室决定,在国内八大行业全面建设容灾系统。国务院信息办组织银行、电力、铁路、民航、证券、保险、海关、税务八大重点行业信息系统主管部门共同出台的《重要信息系统灾难恢复规划指南》就是一个标志。
  
    “911 之后,一些行业在灾难备份建设上进行了一些有益尝试,例如银行、电信等在进行数据大集中同时也建设了容灾备份系统。但一方面是部分已经建设灾备系统的企业,存在大量重复建设和资源浪费的现象;另一方面,很多企业对灾难备份认识不清,结果整个系统建设流于形式。”国信办网络与信息安全组组长王渝次指出。
  
    总体上看,国内灾难恢复体系基础仍很薄弱,存在一些亟待解决的问题。如对灾难恢复工作的重要性、紧迫性认识还不到位;许多重要应用系统甚至还没有建立基本的数据级灾难备份措施,不具备恢复能力;重要应用系统灾难备份建设的法规和标准不完善;灾难备份建设缺乏统一的规划和部署,存在盲目建设和发展的倾向等。同时,已有灾难备份中心缺少切换演练,一些单位建设灾难备份中心存在资源、费用困难等。因此,《重要信息系统灾难恢复规划指南》的出台,也直接带动了灾备项目的新一轮热潮。
  
    技术发展推动容灾普及
  
    与几年前相比,灾备方法、手段没有太大的不同,但存储技术有很多突破的发展,不仅出现了更多容灾产品,同时已有容灾产品功能也更加完善,它们能够支持和实现更多级别的数据和应用容灾,性价比方面也有了更大地提升。其中存储的虚拟化技术、SAN 路由技术以及SATA、 SAS 等技术的出现为容灾提供了更多的选择。
  
    “传统的容灾技术比较适合单一大型机的应用环境,如传统的金融数据中心和电信数据中心等,而在复杂多变的开放式IDC 或类似环境中,则显得无力。而虚拟化技术的发展则为实现异构环境中的容灾提供了技术保证,同时也为用户建立灾备中心提供了更多的选择。”任志辉表示。
  
    惠普公司容灾系统专家也指出,从全球范围内看,开放与虚拟化将是行业容灾系统建设的全新标准。首先,新的企业容灾系统需要建立在开放系统之上,这是企业容灾系统的总体拥有成本具有高性价比的根本所在;虚拟存储技术原本的目的,主要是提高存储系统的利用率,简化对存储系统的管理。传统的存储环境中,开放系统的容量利用率仅为 40-50%,而利用存储虚拟化技术,存储系统实际的容量使用率达到80%-85 %。同时在虚拟化环境中,所有的存储管理操作都可自动实现,存储管理变得轻松简单。正是由于开放系统以及虚拟化技术所带来的利益,数据容灾系统的标准发生了本质性的变化,开放系统与存储虚拟化正在成为新的标准。
  
    “存储网络的发展和容灾需求催生了SAN 路由技术”。博科通讯大中国区技术总监司马聪表示。传统光纤通道技术在容灾应用中存在一些局限性。一般而言,利用传统光纤通道交换机的级连来构成一个大型的 SAN网络时,光纤通道交换机越多形成的SAN 网络就越大,往往形成广播风暴,尤其在各种容灾系统中本地和异地的 SAN一旦连接起来就形成了一个大的网络,在本地和异地 SAN同属一个网络的前提下,它们之间的长距离连接如果发生连接波动的话,就会诱发波及S A N 全体的重组(F a b r i c reconfiguration ),这是造成容灾系统不稳定的一个重要原因。同时,光纤通道传统的结构也不能适应多点容灾需求。而光纤通道SAN Fabric间路由技术(SAN 路由技术)即可以把各个 SAN网络连接起来又能够保持其相互的独立性,为网络存储和容灾系统带来了许多好处。
  
    同时,由于SATA/SAS等新技术的出现,电信网络租用成本的降低,使得灾备中心的建设成本和运营成本都有很大的下降,同时也使得容灾备份产品有了更多的选择,甚至使得平民化的容灾方案成为可能。
  
    灾备外包渐成气候
  
    目前,随着灾备需求的增大、灾备技术的成熟以及相关法规的不断完善,灾备外包正成为一个趋势。
  
    “自建灾备中心对于企业的资金和技术的要求高。一次性投资巨大,灾难备份中心的资金投入涉及建筑工程、机房配套工程、IT系统投入、通信网络设备投入,而这笔投入是为小概率的事件准备的,平时都处于闲置状态,导致总体投入成本(TCO )和投资回报率(ROI )不对称,灾备中心资源利用率低。因此,自建灾备中心并不是每个企业都愿意或者都有能力去承担的。”参与指南制定的万国数据(GDS )公司首席灾备顾问汪琪指出。
  
    中国人民银行科技司副司长李晓枫在对金融行业的灾备工作的建议中也指出:应客观认识灾难备份的社会化服务问题,社会化服务包括灾难备份服务整体外包、投资参与灾难备份设施建设、租用第三方灾难备份设施、利用社会专业技术力量运营管理和应急支援等多种形式。 
  
    汪琪认为,外包模式最突出的特点是客户和IT企业各自能够充分发挥自己的专业化分工。同时外包可以降低灾备成本、获得专业化服务、缩短灾备上线时间、降低灾备建设风险,更重要的是客户能够将主要力量投放在提高核心竞争力的主业上。因此,外包的模式比较适合风险控制要求高,资产规模中等或偏小、技术与管理实力较弱的企业。
  
    目前,一些客户在灾备外包方面已经进行了有益尝试。深圳发展银行的灾难备份外包就是我国商业银行灾难备份建设的一个典型代表。2001 年7 月,该行与万国数据签订了长期灾难备份外包合同,该系统于2002年5 月投入运行,目前已通过多次系统验证和每年度演练切换测试。而今年1 月采用全外包模式的中山证券集中交易容灾备份系统,在深圳市金慧盈通数据服务有限公司和深圳证券通讯公司共同构建的证券 IT托管中心正式开通。中山证券的灾备系统由金慧盈通提供灾备系统所需的全部硬件设备和软件系统,并负责系统的建设和运行维护,中山证券只需要支付一定的服务费,即可享受金慧盈通提供的专业化服务,这是证券行业灾备外包的首次尝试。
  
    当然用户在选择外包方式时也存在一定的风险,包括外包服务商的自身实力、专业化水平、服务质量、信息系统失控、关键数据流失等等。 
  
    任志辉还指出,外包还需解决以下几个问题:首先在外包安全和服务等级方面还缺乏具体的法律法规;其次在业务服务等级以及恢复等级等方面还没有具体的定义和强制措施,国家应制定相应的外包规范和准入制度;第三,虚拟化技术等方面还需要进一步成熟,使得不同平台、不同系统的容灾备份能够实现。另外,在应用系统和服务器管理、数据库维护等方面还有许多技术需要进一步探讨。
  
    在北美灾备外包市场上, SunGuard 、IBM 、惠普等占有很大的市场份额,在国内万国数据(GDS )在深圳有一个灾备外包中心,并已为银行、证券、政府等客户提供外包服务;IBM 在天津、上海和深圳有三个中心,目前的业务主要是服务外资独资企业。
  
    业务技术8/2 开
  
    最可喜的是,经过几年的发展,国内在灾备项目的实施方面积累了很多成熟的经验。
  
    “很多客户开始时误认为灾备是技术项目,其实灾备项目不是单纯的技术项目,而是业务项目,早期的BCP (业务连续性规划)是最重要的,BCP 要占整个项目80%的工作量。”任志辉认为,灾难备份项目强调的是业务不中断而不是I T 不中断,现在客户已经越来越认识到,灾备的目的不仅是防止数据丢失,而是保证业务的连续性,因此从项目名称上,很多客户已经不再称为灾备,而是改称为业务连续性项目。 
  
    辽宁移动是中国移动的第一个灾备项目,也是EMC 一个典型的BCP 项目,该项目经历了从前期业务规划到事后演练整个过程。任志辉介绍说,该项目前期根本就没有涉及到技术,80%的工作都是在进行BCP 的规划。而且BCP 涉及到各个业务部门,大量的工作是与业务部门人员进行沟通,而只有灾备技术方案是与 IT 部门完成的。BCP 规划完成后在确定灾备方案时也要根据 RTO和RIO 的要求,分成不同的层面来考虑,例如有些需要数据同步技术,有一些需要应用级容灾,还有些只需要本地备份就可以。在运行过程中,灾备的演练也是非常重要的环节,该客户已经成功进行了灾难恢复的演练。“
  
    结束语
  
    今年是灾备市场快速发展的一年,但总体看中国灾备市场仍是刚刚起步,市场的成熟不仅需要客户逐步走向成熟,还需要国家的指导,尤其是政策、法规方面的不断完善。