中国交通银行数据备份存储解决方案

项目背景

   交通银行遵循“统一规划、上下结合、重点突破、全面推进”的总体要求,调动总分行两个方面的积极性,加大电子化为业务发展服务的力度,取得了明显的成效。

       全国86个大中城市的分支行都已开通了储蓄通存通兑,其中66个城市的分支行推广应用了将本外币、全储种同城通存通兑系统和太平洋卡处理系统融为一体,具有“一卡通”功能的新型零售业务处理系统。总行建立了太平洋卡交易信息转发、清算中心,并连通了48个城市的分支行,初步实现了太平洋卡“全国通”,构成了交通银行通存通兑网络体系。总行SWIFT系统与全行所有开办外汇业务分支行的SWIFT报文收发系统实现了实时联结。“自助银行”在全行大面积应用,“网络银行”等金融创新产品已在部分行投入使用,这些都为全行私人金融业务的发展提供了有力的技术支持。

       随着近年来交通银行业务规模的扩大, 交通银行业务系统的数据量逐年增加,对系统稳定性和数据的可用性提出了新的要求。如何保障系统数据的安全,保障银行业务系统的正常运行越来越重要。因为在银行业务系统中也越来越体现出“数据是无价”的这个概念。一旦数据发生丢失,许多用户的信息都会丢失。交通银行当前对数据的依赖性越来越强??从银行的业务系统到银行内部的OA系统, 所有的信息几乎都以数据的形式保存在各种存储设备中。 每天进行的业务交易都会产生大量的数据, 银行业务从个人存贷款,到外汇业务,再到个人理财和网上银行, 来自各方的数据会汇集到银行中。因此银行对数据可用性提出了严格的要求。

      在数据量较小和系统运行的前期,对数据的备份工作还不是特别要求。但随着交通银行系统的数据量每天的增加,数据的保护和存储越来越重要。数据自动备份势在必行。正是在这种情况下,备份应用迫切地提到了银行系统升级的日程上。

需求分析

  交通银行现已采用了一些技术保障系统防止单机故障, 但如何在系统在数据丢失和需要恢复时快速有效地恢复原有数据仍是交通银行特别重视的一方面。

      由于交通银行内部关键业务应用非常广泛,机器数量比较多,有各种包括IBM和Sun的操作系统。 为有效安全地运行和可靠地管理, 交通银行应当是一个覆盖较大区域的、所有操作系统平台的、各种数据库系统的统一的备份解决方案, 它对网络备份提出了更高的要求,这些要求包括:近乎实时的备份要求、远程的数据保护及快速的系统恢复等。由于这些功能非常复杂,所以普通的备份软件已远远不能适合需求。

      交通银行总行首先考虑了总行信息系统的数据保护。交总行已于2002年9月迁往陆家嘴交通银行大厦,同时对信息系统进行了重新规划和更新,新的系统部分采用了SAN存储结构。对于数据量大的部分IBM小型机,备份时考虑LAN-Free方式,其它服务器(Sun、Sco、NT、NetWare等),采用LAN备份方式。以下为总行信息系统结构示意图


对于备份的要求,主要分为三个部分:
1. SAN结构中的数据库部分
• 主要是IBM S85上的Sybase数据库
• 要求在线、自动化数据备份
2. LAN结构中的数据库部分
• 主要是LAN结构中SunE5500、IBM M85、M80等服务器上的Sybase和Domino数据库
• 要求在线、自动化数据备份
3. LAN结构中的文件服务器部分
•SCO Unix、NT文件系统,NAS服务器上的数据,大量数据文件
• 要求在线、自动化数据备份

交通银行总行数据备份存储解决方案及应用效果

  在这个系统中,交总行采用了集中统一的备份策略管理,通过NetBackup SAN Master Server,对整个数据库和文件系统的备份工作进行集中的管理、监控。用IBM S85服务器作为SAN Master Server,负责整个备份系统的管理,包括备份策略的制订、备份数据库的保存。该服务器同时也是一个NetBackup SAN Media Server服务器,负责将本机的数据或客户端的数据备份到磁带库中。

       NetBackup SAN Media server安装在SAN结构中其它需要备份的服务器上,负责备份本地数据。

       NetBackup client安装在其它网络服务器上,负责将各自服务器上的数据通过网络送给主服务器备份。

       每台Sybase服务器还安装Sybase agent, 负责NetBackup与Sybase Backup Server的集成,完成Sybase数据库的在线热备份。

       每台Domino服务器还安装Domino agent, 负责NetBackup与Notes Backup/Restore API的集成,完成Domino数据库的在线热备份。

       交总行的NAS设备采用了IBM的开放式NAS,其NAS服务器是由PC服务器和存储设备组成,因此直接在该NAS设备上安装NetBackup Client for NT/2000,而不通过NDMP进行(通过NDMP,需要有磁带机直接与NAS服务器连接)。

       实施了VERITAS BMR智能灾难恢复,当某服务器出现系统故障时(例如引导盘失效),可以不重新安装操作系统,快速进行系统恢复。

       一个大容量的STK磁带库,4个Driver, 直接连接到光纤交换机。

    交总行信息系统备份管理主要有以下特点:

    自动备份策略
   交总行备份系统实施完成后,所有信息系统的备份任务都由NetBackup软件统一管理并根据定义的备份策略自动发起备份作业。NetBackup的备份策略定义非常灵活,可定义每天某一时刻、每周某天、每月某天、某一特定日期开始进行备份,也可以定义某一特定日期不进行备份(避开业务繁忙的日期)。

    多层管理结构
   NetBackup拥有一个四层体系结构,集高级介质管理和纯速度于一体,可满足最大的数据中心的需求。第一层由NetBackup主服务器构成。主服务器的作用如同“大脑”,用于进行规划和跟踪客户机备份。它可以附带一个或多个磁带设备/库来备份多个客户机的数据。假如企业数据存储在多个不同的地方,或者有数据量很大的应用,如数据仓库,它们可以在对网络上的其它客户机(其他服务器或工作站)进行备份的时候用介质服务器(Media Server)提供大型应用的本地备份。介质服务器可以与主服务器或另一个介质服务器共享磁带库,或者使用自己的磁带设备/库。假如一台介质服务器出现故障,它所附带的客户机备份可以路由到另一台介质服务器上。该结构中的第三层为客户代理层,主要对服务器和工作站进行备份。一般情况下,该层包含的单机数量最多,但储存的数据不一定最多。介质服务器和客户机均可通过主服务器进行集中管理。
  针对要求集中管理多个NetBackup主服务器或分布式的环境的数据中心,VERIRAS通过NetBackup的全球数据管理程序(GDM)建立了NetBackup的第四层。全球数据管理程序可对数据中心内部的所有NetBackup储存域进行集中的管理与控制。这使系统管理员和数据库管理员能够管理NetBackup的各个方面,这有利于保持一贯的管理策略。该程序在数据中心内任何地方都可以监控NetBackup存储域。
这样,今后上海交行各分行备份系统建立之后,可以在总部统一管理和监控各分行的备份任务、设备及策略,实现分散备份,集中管理的优化模式。

    高性能
   NetBackup支持SAN,多磁带流的并发备份、多客户并发备份和磁带复用技术,备份速度快,并可支持SAN下的LAN-Free 备份,避免了备份数据对网络带宽的占用。多数据流的技术,使交总行在进行数据备份时同时使用4个驱动器并行进行,大大提高了备份速度。

    系统保护
   交总行信息系统备份软件实施时,对最关键的IBM小型机和Sun服务器(分别运行了数据库和Notes系统)进行BMR智能系统保护。利用这项技术,备份服务器会自动在对系统文件进行备份时检查系统配置信息,并将更改后的配置信息(例如IP、磁盘分区等)传给备份服务器。当系统灾难性故障时,可以由BMR生成的启动光盘进行启动,并得到配置信息,直接进行系统的恢复,可以大大提高系统恢复速度。这个解决方案比常规的单机系统保护手段有很大的提高,无需管理人员频繁进行单个系统的备份保护。

    BMR方案有以下特点:
•全自动系统恢复 ? 通过一个命令,系统将自动执行服务器恢复任务,基本不需要用户进行干预,而且保证实现百分之一百的完整性和一致性。
• 简单易行的“傻瓜”恢复过程 ? 在恢复数据之前,再也不需要由技术娴熟的技术人员重新安装操作系统和 配置硬件。
• 加快服务器的恢复速度 ? 由于减少了设置系统和配置硬件的时间,服务器执行恢复的速度会加快,因此将使停机时间减少到最低限度。
• 自动恢复服务器配置 ? 在每次执行预定备份任务时,系统将自动记录和更新磁盘配置和网络设置的详细信息,保证使所有系统配置完全恢复到故障发生前的状态。
• 连续快速恢复 ? 能够执行多个服务器的恢复任务,同时执行海量恢复操作。
• 一个解决方案满足多种OS平台 ? 同一个解决方案,可恢复AIX、HP-UX、Solaris、Windows NT、Windows 2000。

    其工作方式如下:
   BMR功能与NetBAckup备份协同工作。客户机仍像以前那样备份至NetBackup服务器。但在执行每项预定备份任务之前,系统将自动执行附加过程,即记录服务器配置的当前状态,其中包括磁盘配置和网络配置。如果服务器配置被修改,系统在执行备份时,将自动捕捉和记录这些修改,不需要用户进行干预。

      利用BMR进行恢复非常容易,因为恢复过程已经实现自动化。用户既可以使用BMR server的命令行,又可以使用基于浏览器的简单界面。只要发出“prepare to restore”(准备恢复)命令,系统就开始执行恢复。些时,BMR将立即检索客户机配置数据,并使用该数据创建一个定制化的客户恢复程序。然后,通过网络为客户机发送相应的引导数据和文件系统。客户机将通过BMR boot server执行引导,并开始运行定制引导程序。引导程序将执行一列任务:
•通过BMR File Server,安装必需的启动系统。
•根据BMR server中的信息配置磁盘、逻辑卷、文件系统等。
•向NetBackup发送命令,从NetBackup server恢复文件,其中包括操作系统、配置数据、应用程序和用户文件。

      完成这些任务后,客户机将配置引导记录及配置数据库,并重新执行自引导,然后系统即正常运行。

      如果不需要改变服务器配置,除初始网络引导外,将不需要进行人工干预。由于BMR是一种多平台产品,用户可以通过一个公用界面,恢复一系列系统,从而大大降低成本。

应用效果

  中国交通银行总行信息系统备份项目的实施,为保护交行信息系统数据提供了保障。由于采用灵活的备份策略和统一的管理,管理员每天只需通过监控界面对备份任务进行监控,就可以对备份作业的执行情况了如执掌。由于采用了多个驱动器同时进行数据备份,每晚的备份作业可以在1个小时内全部完成。交总行电脑部的技术人员介绍说:“VERITAS的备份软件在自动管理、系统保护等功能上比以前的类似软件有很大的提高,为我们的信息系统数据保护提供了很好的帮助,大大降低了系统的风险程度及人力资源成本。”