DELL存储的医院数据资产“大一统”解决之道

    无锡市第一人民医院应用戴尔设备建设“分类存储、一体备份、重点容灾”的医疗数据中心

    客户需求:无锡市第一人民医院计划引进存储、备份和容灾设备,建设一个支撑“HIS、PACS、电子病历和社会保险”等四大核心医疗业务系统的数据中心。

    解决方案:包括DELL|EMC CX300光纤盘阵和PV160T带库在内的戴尔存储设施成功入选,它们共同为医院建设了一个“分类存储、一体备份、重点容灾”的医疗数据中心。

    应用效果:在上述戴尔存储设施的强有力支撑下,数据中心的建设取得了成功。

    医疗业务系统全面上线

    无锡市第一人民医院创办于1927年,至今已有80多年的历史。多年来,该院在泌尿外科、血液科、心血管内科等专业领域积累了非常雄厚的医疗技术力量;特别是在人工起搏、肝肾移植等一批尖端医疗项目上,该院已达到国内先进水平。在信息化建设方面,无锡市第一人民医院同样走在国内同行的前列。近年来,该院已先后建成了“医院信息系统(HIS)”、“医疗影像存储与传输系统(PACS)”、“电子病历系统”、“社会保险系统”等几大核心医疗业务系统。

    其中,“医院信息系统”是医院的管理中枢,它包含财务、人事、住院、药品、门诊、医技、病程、收费等多个子系统,同时承担着“临床管理”与“行政管理”的双重使命;“医疗影像系统”是医院的影像中心,它承担着从CT、X光机等各类成像检查设备中采集影像资料、对这些资料加以处理和存储、并为一线医师提供查询服务的使命;“电子病历系统”是医院的病历中心,它详细记录了患者的治疗方案和治疗过程,既为医院积累了宝贵的治疗经验,又为处理医患纠纷提供了不可或缺的证明文件;而“社会保险系统”则连通了医院与社保部门的业务后台,它为医院接诊并服务好广大社保患者提供了支持。

    数据资产管理问题凸显

    HIS、PACS和电子病历等系统是在不同时期分批建成的,各系统的数据处于分散存储状态,不仅如此,每个系统所采取的存储方式与存储介质也各不相同,有些存储介质已经落后。随着上述系统应用规模的不断扩大,它们在数据管理方面的问题日益凸显出来:

    首先,存储后台容量不足,数据调用不便。以PACS为例,该系统上线后,数据规模呈几何级数增长。按照原来的存储方式,这些数据被存放在系统外挂的盘阵之中。由于盘阵容量有限,因此不得不定期对盘阵进行清理,并将历史文件采取刻光盘的方式加以保存。一旦医生需查询这些历史文件,就只能到光盘库中去检索,这使他们感到非常不方便。

    其次,链路结构相对落后,系统稳定堪忧。上述系统原来的存储后台多采用单独SCSI链路,这种链路方式不仅带宽较低,而且由于没有冗余,可用性也较差。仍以PACS系统为例,有些医生反映,该系统在同时调出多个大尺寸影像文件时,有时会因链路问题而发生迟滞。

    最后,分散存储的模式,严重影响了数据资产的管理效率。从系统维护的角度看,每个系统的数据都要单独备份,这样的重复操作不仅费时费力,而且难以给各系统的数据资产提供同一水平的保护;从资源调配的角度看,不同系统的存储资源和备份资源无法相互调剂,因而造成了厚此薄彼、资源浪费的现象。

    就上述三个问题,医院信息中心指出:“医院的信息化工作走到今天,随着各类应用系统的不断增加与日益成熟,我们越来越感到:必须对数据资产的管理有一个通盘的考虑,有一个集中管理方案。这样做,不仅有利于数据的安全和系统的稳定,而且能够为我们将来对这些数据资产进行深度挖掘、实现知识管理,奠定坚实的基础。”

    “分类存储、一体备份、重点容灾”的管理方案

    为了实现集中管理,医院信息中心首先对上述四个系统及其后台数据进行了整体规划。他们发现,这些数据按其自身特征可划分为“PACS数据”和“非PACS数据”等两大类,前者专指PACS系统的数据,后者包括HIS系统、电子病历系统与社会保险系统的全部数据。

    这两类数据的差别很大:前者主要是多媒体文档,其并发访问量小,但文件尺寸比较大;后者包括传统文档和数据,其并发访问量大,但数据尺寸小。从系统本身的角度来看也是如此:无论是持续可用性、数据安全性,还是响应速度,其它三个系统都比PACS系统的要求高。

    考虑到两类数据、两类系统的上述差别,信息中心最终制定了“分类存储、一体备份、重点容灾”的数据资源集中管理方案。具体而言,就是对“PACS数据”和“非PACS数据”分别加以存储,统一实施备份;与此同时,只对其中“重要且读写频繁”的“非PACS数据”实施异地容灾。在此基础上,建设一个涵盖上述四大系统的医疗数据中心。

    该院信息中心负责人在解释这一思路时说:“数据集中管理的核心是要把各种数据资产作为一个整体给予通盘考虑,而不是简单地把它们集中存储在一起。从我们的具体情况来看,两类数据对系统I/O的要求是不同的,如果硬放在一起,在应用高峰的时候,它们可能会相互影响。正是基于这样的考虑,我们为两类数据建设了不同的存储后台。”

    戴尔全面担纲硬件平台建设

    上述思路确定后,无锡市第一人民医院开始了存储、备份与容灾设备的选型工作。经过对设备性能、系统稳定性、可扩展性、易管理性等各方面因素的综合考察,2004年9月,院方最终选用了戴尔的整套存储方案,具体包括2台DELL|EMC CX300光纤盘阵与1台戴尔PV160T带库,它们分别承担起存储、备份和容灾的功能,共同为院方构建了一个“分类存储、一体备份、重点容灾”的医疗数据中心。

    该数据中心的四个系统(HIS、PACS、病历、社保)共使用了8台主机,其中:HIS系统采用医院原有的2台其它品牌服务器担任前端主机;PACS系统采用2台戴尔PE6650服务器担任前端主机;电子病历系统采用1台戴尔PE6650服务器与1台医院原有的其它品牌服务器共同担任前端主机;社会保险系统采用2台新引进的戴尔PE2850服务器担任前端主机。每台主机均安装了3块HBA卡,以便与存储后台连接。

    存储后台的具体情况如下:

    第一部分:分类存储

    以1套新引进的DELL|EMC CX300光纤盘阵,外加1套医院原有的其它品牌光纤盘阵,分别担任“非PACS数据”与“PACS数据”的存储后台,这两套盘阵通过2台BROCADE 8口光纤交换机(DS-8B2)与前端的四个系统、8台主机相连接,构成全光纤的SAN结构。

    其中,DELL|EMC CX300存储容量约5TB,它通过2台交换机,与前端“HIS系统”、“电子病历系统”、“社会保险系统”的6台主机构成了全冗余的连接,这3个系统的后台数据(非PACS数据)全部存储于本套CX300之中。

    医院原有的1套光纤盘阵,存储容量约2TB,它通过1台交换机,与前端PACS系统的2台主机相连接,PACS数据全部存入其中。

    第二部分:一体备份

    以1套新引进的戴尔PV160T带库全面承担“非PASC数据”与“PACS数据”的备份任务。为了使数据的备份流程独立于其存储流程,确保链路的冗余,院方在存储SAN之外,用1台16口BROCADE光纤交换机将8台前端主机与PV160T直接连通起来,从而搭建了一个专用的备份网络。

    整个备份过程由8台前端主机上安装的Veritas SAN备份软件直接加以指挥和控制。由于“非PACS数据”和“PACS数据”在增长速度、访问频度、存储介质容量上存在明显差异,院方对它们采取了不同的备份策略:

    “PACS数据”:由于它的访问频度低、数据增长快、存储介质容量有限(2TB),因而对它采取了“逐日迁移、按月备份”的策略。具体而言,就是每天从PACS后台盘阵向PV160T进行数据迁移,以降低存储后台的压力;每月做一次全面备份,以确保数据的安全和完整。

    数据迁移和备份均在夜间进行。每天晚上,PACS系统的两台前端主机会对存储后台进行自动扫描,一旦发现其中的数据总量已经超过总存储容量的70%,且包含有保存期超过60天的数据,就会自动发起迁移程序,将那些同时符合上述两项条件的数据迁移到PV160T之中。迁移后的数据会在原存储后台中留下指针数据,到了月末最后一天的晚上,系统会将本月的所有指针数据备份到PV160T之中。

    “非PACS数据”:由于它的检索频度高、数据增长慢、存储介质容量较大(5TB),因此不需要做数据迁移;它的备份策略是:每天晚上做一次当日增量数据的备份,每周做一次全部数据的备份。

    第三部分:重点容灾

    鉴于“非PACS数据”不仅访问频度高,而且极为关键,院方单独为其设计了一个远程容灾备份系统,以提高这些数据的安全保护水平。该系统由1台戴尔PE2850服务器与1台DELL|EMC CX300光纤盘阵共同组成,其中,PE2850负责运行Veritas备份软件,实施备份管理,该服务器基于新一代英特尔技术的双路平台,采用了包括PCI Express I/O、DDR2内存、64位英特尔?扩展内存等一系列创新技术,更高的带宽和更强的内存寻址能力为数据密集型应用提供了更卓越的性能;CX300具体担任容灾备份的存储后台,它们处在与存储SAN不同的物理位置,通过1台BROCADE8口光纤交换机,与存储SAN相连通。

    负责容灾备份的这套DELL|EMC CX300,共配载了约4个TB的存储容量。具体的备份方法是:每隔1小时,灾备系统中的PE2850服务器会自动对存储SAN进行扫描,以便对其中的“新增数据”进行文件复制和日志快照,并将复制和快照的结果保存到负责容灾备份的那台CX300之中。

    整个方案拓扑图如下:


    性能优异的硬件平台,贴近用户的直接服务

    2004年12月,按照上述方案建设、由戴尔存储设施全面担纲的无锡市第一人民医院医疗数据中心正式上线。到目前为止,该中心已稳定运行了2个多月的时间。中心一举创造了两项第一:江苏省卫生系统内第一个采用全光纤SAN结构的医疗数据中心、国内第一个以戴尔PV160T为基础的高性能光纤通道备份系统。

    从运行效果来看,该中心“分类存储、一体备份、重点容灾”的设计思路是科学的,数据中心的建设是成功的,通过对数据进行集中管理并为不同类型的数据设计不同的存储与保护方法,整个数据中心系统以最合理的投入,实现了最优化的数据处理流程与服务支持结构。

    数据中心获得成功的另外一个重要因素是存储设备的正确选择。包括DELL|EMC CX300和戴尔PV160T等在内的高性能存储设备,以出色的表现为数据中心各项设计目标的最终实现,奠定了硬件方面的基础。

    以担当备份重任的戴尔PV160T为例,它突出的“大容量”、“高速度”与“易管理”优势,使医院数据中心在数据备份功能方面,达到了国内领先的水平:


  • 从容量来看,PV160T使用的LTO-2磁带,单盘不压缩可存200GB数据,压缩后可存400GB数据。无锡市第一人民医院此番引进的PV160T共有294个槽位,如果全部配满,总存储容量将高达58.8TB(不压缩)和117.6TB(压缩)。按照目前医院数据每天5GB、每年1.5TB的增长速度,这套PV160T带库在不压缩的情况下,也可供医院使用39年。
  • 从速度来看,PV160T的磁带驱动器不仅能以每秒30MB的速度实现数据的快速备份,而且能够以极高的效率响应用户的检索请求。这种卓越的响应能力,是PV160T相比于“光盘备份”和“传统带库备份”的一个革命性进步。现在,医生如需向PV160T检索备份的PACS文件,即使在每天上午高峰时段,最多也只要1分钟就可以找到文件并将之打开。
  • 从易管理性来看,PV160T的管理接口与管理界面都十分先进。用户可以用WEB方式对PV160T的运行状态实现远程的监控、调整和设置,而无需进入机房进行现场维护;不仅如此,PV160T还允许其内部的磁带驱动器直接连接到光纤通道交换机上,而不必使用价格昂贵的“SCSI至Fiber”通道转换器。本方案正是利用这一特征,通过连接一台16口光纤交换机,建立了一个独立、高速的备份与查询网络。
    再比如分别承担着存储和容灾任务的2套DELL|EMC CX300光纤盘阵,它们不仅以强大的性能支持了数据中心的高效、稳定运行,更以卓越的可扩展性为数据中心的未来发展预留了充足的增容空间:
  • 在处理能力上,CX300采用了800MHz的存储处理器与高达2GB的高速缓存,这样的配置为CX300快速地“处理”与“收发”数据,提供了强大的动力;在系统I/O上,CX300能够提供5万次/秒的缓冲I/O、680MB/秒的持续带宽,这两项指标对于支持HIS等OLTP型应用,具有非常重要的意义。
  • 在优化能力上,CX300允许用户根据前端不同应用的具体需求,对系统的高速缓存进行调配,从而实现系统性能的动态优化。在本方案中,作为存储后台的CX300分别支持了3项不同的应用,医院方面非常需要在实际运行中了解不同应用的需求压力,并据此不断对CX300的缓存资源做进一步的调整。
  • 在可扩展性上,CX300可在单一阵列中支持64台服务器,并可轻松扩容到8.8TB,这就为应用系统与数据资源的扩张奠定了基础。目前,无锡市第一人民医院已开始着手将其它一些应用系统(如医院的远程教育系统)接入本方案的SAN之中,今后本医疗数据中心将有望成为全院所有数据资产的“大一统”管理中心。

    在对上述戴尔存储设备表示满意的同时,无锡市第一人民医院信息中心的刘喻主任还对戴尔的服务表示了认可,他说“此次系统集成前后经历了大约两个月的时间。为确保设备安装、调试不影响医院正常的工作秩序,我们一般选择在晚上开展工作。在整个过程中,戴尔工程师在一线为我们提供了极为认真负责的服务,这么复杂的系统一次部署成功,非常难得。”

    他还指出:“部署过程中需要很多零配件,按照以往使用其它品牌的经历,要么会多出一堆,要么会漏掉几个,总之很难恰到好处。这次我们也担心会出现这种情况。然而,戴尔计算得特别精确,大到各种驱动器,小到一根连线,最后是一个不多,一个不少。更重要的是,这些零配件都是在厦门经过测试后才发送过来的,节省了我们很多时间。”