CDP在天津医大二院信息系统灾备建设中的应用

DoSTOR存储在线天津医科大学第二医院网络中心是天津医科大学第二医院(简称天津医大二院)的信息系统核心,由于天津医大二院的前台医疗业务操作已经全面朝向信息化,其信息系统运行的稳定性与数据保护能力,直接关系到医院的核心竞争力和业务的正常运转,更代表着其面向社会的服务能力与整体形象。从有效提升竞争力与保证业务持续性的角度出发,天津医大二院网络中心深刻的意识到对医院核心信息系统提供保护,使之免受各类灾难的冲击,具有抵御各类风险的能力的重要性。

天津医大二院网络中心目前的核心系统包括HIS医疗信息管理系统(2HP ProLiant DL740服务器组成的Windows集群+SQL Server 2000数据库)、LIS检验信息系统(IBM x3650服务器+Oracle数据库)、电子病历系统(IBM x3650服务器+Oracle数据库),以及1HP StorageWorks MSA1000磁盘阵列,未来还计划加入PACS等系统。而负责保护这一整套核心系统的仅是Veritas Backup Exec备份服务器和HP的自动加载磁带机(Autoloader)。随着医院的业务量持续增加,系统及数据保护的问题日益变得尖锐。一套完整、全面的数据保护解决方案成为医院网络中心要解决问题的关键所在。

考虑到医院的业务系统不能停机、现有生产系统的结构不能改变、未来系统需要扩展、抵御的灾难范围要广泛、灾难恢复速度要快、人力及资金成本投入要节省以及对既有存储的充分利用等一系列的问题,新的数据保护解决方案必须具备易于管理、充分开放、无限扩展、快速恢复、容错抗灾、预算合理的诸多特质,什么样的数据保护解决方案才能一并满足如此多的需求呢?

磁带机+集群架构无法提供完整保护

负责主管信息建设的天津医大二院网络中心的志翔主任表示,由于各信息系统的数据量增长速度相当快,备份服务器和磁带设备的性能却没有改善,导致每天备份所需要的时间越来越长;需要恢复数据时,必须花费比以往更多的时间,但还是无法实时验证备份数据的安全性和一致性。此外,一旦数据库服务器出现突发性故障,除了修复硬件之外,还必须从磁带机中恢复服务器的系统和数据,恢复时间难以掌握,可能造成的营业损失更是难以计算。

再者,HIS服务器虽然已经通过集群架构加强了系统的容错能力,但对病毒、黑客入侵、人为操作失误等软错误还是没有抵御能力;两台以上的集群服务器共享一套存储系统,也容易产生单点故障,从而无法保障医疗信息管理系统持续不中断的提供服务。

我们原本以为部署了集群架构之后,就可以避免服务器故障停机的情况发生,但我们却忽略了存储设备的单点部分,虽然发生的机率极低,但一次意外的磁盘阵列柜背板损坏,就造成整个集群架构失效,HIS数据库停止运行了好一段时间,给医院造成了直接的损失,这可着实给我们上了一课。志翔主任说。经此一劫,为核心系统选择完备的保护解决方案的工作也由计划提上了日程。医院是个关系百姓生命的行业,当医院的业务操作实现数字化之后,信息系统能否稳定可靠的提供服务,关系着前来就医的患者的性命,岂能马虎。因此,天津医大二院网络中心在为核心系统选择新的保护方案时,可说是格外的仔细小心。经过反复的评估与测试验证,天津医大二院网络中心最终选择了美国飞康软件公司的CDP持续数据保护解决方案来保护他们一系列的关键业务系统。

飞康CDP 解决方案是以飞康公司专业的、备受肯定的网络存储技术为基础,结合先进的同步复制与快照技术,构成的全方位的数据/系统保护解决方案。根据天津医大二院的切实需求,这套方案由本地保护和异地容灾两大部分组成:一期,在现有门诊楼网络中心部署一台CDP存储管理器,通过安装在应用服务器上的DiskSafe软件,实时抓取应用服务器的I/O数据,通过旁路复制到CDP存储管理器,实现本地数据保护;二期,在马上建成的门急诊综合楼网络机房再部署一台CDP存储管理器,保护门急诊综合楼所有应用服务器的同时,在门诊楼和门急诊综合楼两机房的CDP管理器之间通过IP网络,采用连续复制的方式将数据复制到远端,实现异地灾备。同时配合飞康特有的TimeMark自动快照技术产生时间点快照(CDP存储管理器最多能够产生256个快照)以提供故障时的快速恢复。

快速容灾恢复,系统运行不中断

天津医大二院网络中心包括HIS系统集群服务器在内的每台应用服务器,都安装了DiskSafe以及数据库备份代理程序(DB Agent),通过Gigabit高速网络和iSCSI存储通讯协议,持续的将应用服务器的数据同步写入到后台的CDP 存储管理器。存放在CDP 存储管理器内的数据,再通过飞康独有的TimeMark快照技术,以每小时为单位快速的抓取磁盘副本。一旦应用服务器出现意外,系统管理员可以通过iSCSI SAN Boot机制,利用CDP存储管理器内的磁盘副本直接启动操作系统,只需重新开机和简单的操作,即可将应用服务器恢复到正常工作的状态。

一套飞康CDP解决方案就能给服务器操作系统和数据的提供双重保障,而且操作管理简单,无论是文件或整个系统,恢复速度都很快,这些优点是原来的集群和磁带备份做不到的。志翔主任表示。飞康CDP部署完成后,不仅大幅缩短了医疗信息系统的意外停机时间,实时的提供数据备份与恢复,更为天津医大二院的日常工作带来了相当大的帮助。医院同事们在操作信息系统时,因一时疏忽误删文件是常有的事,以前碰到这种情况,必须从前一天的备份磁带中找到文件再进行恢复,相当的耗时费力,现在只需通过简单、人性化的操作介面,轻击几下鼠标,就可以找回一小时前的文件,恢复速度和操作简易程度简直难以想象。

在系统集成商的协助下,目前医院一期针对本地网络中心的飞康CDP数据保护解决方案已经顺利部署完成,上线至今的运行情况良好,院方对这套方案的成效相当肯定,并自动加快了在即将建成的医院门急诊综合楼网络中心搭建异地灾备架构的步伐,以尽快为医院的信息系统保护加上双保险。

提到异地灾备,传统上会采用的技术不外乎两种,一种是通过安装在应用服务器上的复制软件,将本机数据以同步或异步的方式复制至容灾站点;另一种是通过存储系统内置的复制功能,以同步或异步的方式传输至容灾站点的存储系统内。前者必须为每一台应用服务器安装复制软件,不仅管理困难,更会影响应用服务器的性能;后者则必须在两地部署相同的存储系统,而且通常只有中高端存储设备才支持这项功能,成本相当昂贵。显而易见,这两种异地灾备技术都不适合医院的需求。

在成本与性能之间取得最佳平衡的异地灾备方式

飞康公司为天医大二院设计的异地灾备架构,同样是通过CDP技术以连续数据复制的方式实现的。即在原门诊楼的网络中心(生产中心)本地将新综合楼容灾中心的CDP存储管理器和生产中心的CDP存储管理器建立数据复制关系,将数据进行初始化同步,在不改变复制策略的情况下,将容灾中心的CDP存储管理器接入容灾中心系统,第二次复制时CDP数据器会启用ScanDifference技术比较两台CDP存储管理器之间的数据差异,会以增量的方式将生产中心新产生的数据复制到灾备中心的CDP存储管理器中,整个过程不需要做任何配置,生产中心的应用也无需中断,同时也不会影响到医院的日常运营,以最短的时间、对现有环境最小的影响,轻松将本地机房的系统与数据保护延伸至远程。而在复制过程中,通过飞康公司独特的MicroScan技术传送的封包可缩小到只有512byte32Kb1/64),并自动去除冗余数据,如此不但可以大幅降低本地和远程之间的网络带宽需求,在灾难发生后,更可以缩短本地数据的恢复时间,在成本和性能之间达到最理想的平衡。

志翔主任表示,当第二期的飞康CDP异地灾备方案构建完成后,整个天津医大二院的信息系统将真正迈入安全可靠、持续运行的状态,以更稳定的质量与更完善的效率,为医疗、财务、行政和后勤管理提供服务,在提高医院经济效益的同时,落实服务于患者、服务于社会的宗旨。