某儿科研究所成立于1958年,是新中国第一家以研究儿童保健、儿科疾病为重点,兼有医疗、教学和预防任务的应用医学研究机构。1986年附属儿童医院正式开院。全所现有员工910余人,其中专业技术人员占89 %,具有高级专业技术职称的有120余人,上世纪90年代以来,研究所先后8次获得市属科研院所“改革与发展”一等奖,11次获得卫生系统文明单位的称号。
作为一家国内儿童保健、儿科疾病研究的权威机构,研究所在研课题97 项,其中部市级以上课题65项,其附属医院承担着大量的儿科疾病的诊断治疗工作。医院信息系统(HIS)和医疗影象系统(PACS)对信息数据安全的要求越来越高,24小时在线的HIS信息系统是医院日常运行的关键,其后台的IT系统,特别是数据库系统是支持关键业务运行的保证,医院不仅要保证业务系统持续对外服务,还要保证数据的完整性。而PACS医疗影象系统所产生的大量影象数据,重要性不言而喻,不仅要确保内容不被修改,并且要随时可供调用,还需要长期保存。后台的IT系统如数据库、Web服务器,邮件服务器等存放有大量重要的信息数据,因此,整个医院的信息存储和信息安全解决方案需要从三个方面入手。
第一.在线数据在服务器级做集群,利用SAN环境下盘阵大容量存储;
第二.对HIS系统数据库做自动的备份;
第三.对PACS产生的大量影象文件做归档处理。
构建SAN信息中心的应用环境
(1)2套小型机
SUN 4800(Solaris 集群):Oracle数据库 HIS系统
(2)2套小型机
SUN 4800(Solaris 集群):Oracle数据库 PACS系统
(2)3套Windows2K服务器 :OA、WEB、MAIL服务
HIS系统、OA、邮件等关键应用数据全部存储在EMC磁盘阵列中,由 SureSave虚拟磁带库对在线数据、应用程序与系统文件等信息进行自动备份。PACS产生的大量影象数据存放与EMC Centera(基于内容寻址技术CAS的对固定内容数据的归档方案)
针对该信息中心现状,我们提出存储系统建设总体方案如下:
将HIS系统和PACS系统服务器统一起来,建立存储区域网(SAN);
SureSave VTL作为备份设备,建立自动数据备份系统。
增加EMC Centera 归档设备,对影象文件做长期保存。
备份系统示意图
EMC Centera 解决方案
世界上第一个完整的针对固定内容的存储解决方案
如今,金融服务、医疗保健和政府部门的客户都面临着电子固定内容急剧增长和管理法规问题,EMC Centera 被公认为是业界解决这些问题的最佳解决方案。运用EMC Centera,您能够以低得多的成本来管理大量的固定内容。仅一个全职雇员就可以管理高达350 TB 的固定内容。Centera 满足了您的随机存取和同步使用要求。EMC Centera 通过极大地降低管理成本、促进数据整合和协作以及提高服务级别,为政府机构提供一个用于存档数据的最佳存储解决方案。政府的许多领域都可以从Centera 中受益
它的工作机对Centera 进行的记录读写操作是通过用户的软件应用程序(如电子邮件存档、报告管理或文档管理系统)完成的。软件应用程序使用一组特定的指令(应用编程接口)请求Centera 存储、检索和删除记录。每一个存储在Centera 中的记录都有两个组件:内容和与其关联的“内容描述符文件”(CDF),后者直接链接到存储的对象(业务记录、电子邮件等)。从内容自身派生出的一个数字指纹是内容的定位器(内容地址)。内容描述符文件包含元数据记录属性(例如,创建日期、时间、格式)和对象的内容地址。内容描述符文件用于存取和管理记录。内容描述符文件还作为存储记录的“目录”或“指针”使用。在内容描述符文件中,应用程序将为每一个具体的业务记录指定一个保留期。内容寻址的一种好处是:一个内容项只存储一个副本。如果多人尝试存储同一个业务记录,则它只在多个用户都拥有指向此共同对象的指针时存储一次。因此,让多个内容描述符文件具有指向同一记录的不同保存期是可能的。Centera 将允许在保存期终结时删除指向记录的指针。一旦删除了记录的最后一个指针,存储的对象也随之被删除(也可能被切碎)。
有保障的内容真实性和可用性
存储在Centera 中的内容在指定的整个保存期内保持为不可重写但一直可用。某些标准规定内容需保存10 年、20 年、甚至30 年。在如此长的时间内保持内容的真实性并确保其可用性是当前的技术尚未完全解决的难题。目前市场上有1,200 多种不同的磁带和光盘驱动器格式,可想而知,这种情况会进一步增加现有技术面临的困难。为跟上快速变化的步伐,需要频繁地迁移以确保向后兼容性。直到现在,解决迁移问题对于任何IT 企业来说都仍是一种需要大量手工操作的、资源密集型的任务。不管基础硬件组件如何发展变化,Centera 的内容寻址算法和对象本身都能以不变应万变,因而不依赖于任何材料或系统。Centera 的内容寻址、完整性检查和保留保护能力确保了您的记录真实而且可以存取,而不管保存期要求是什么。
长期保存
存储在磁带这样的介质上的内容会随着时间的流逝而逐渐退化和遭到损毁。这是由磨损和/或不当的存储条件造成的。而且,因为如今大多数最终形式的内容存储在磁带或光盘上,所以没有自动化的方法来定期检查这些记录的可读取性或完整性。与此不同的是,Centera 解决方案纳入了多种安全措施以确保您的记录从创建之初一直到保存期终结始终保持不变。在存储过程中,使用一种称为“内容寻址”(CA) 的128 位散列算法对写入Centera 的每一个记录的质量和准确性进行了多次验证。具有唯一性的内容地址最初在应用程序服务器上计算出来,然后在写入磁盘介质之后再予以重新计算和确认。这一确认确保了每一项记录都能够准确、完整地写入Centera 介质。通过定期根据记录内容重新计算内容地址,Centera 能够随着时间的推移不间断地确保每一项记录的完整性和精确性。假如重新计算出的值与原始值之间有所不同,Centera 将使用内部数据再生机制进行自我修复。
记录级别的管理
与其他存档存储介质不同,Centera 的受控记录管理是在记录级别进行的,而不是人为地限制于驻留在同一张介质盘或磁带上的整个文件组上进行。记录保存期是由存储应用程序在各记录内灵活定义的。在Cenetra 的微码控制之下,此记录在此指定的期限内将不可擦除。当保存期结束时,将可以删除此记录并重新利用其所占用的存储空间。
无人操作Centera 的内容寻址,再加上自我管理、自我配置和自我修复机制,完全消除了存储管理开销。这一点与传统的存储技术有很大的区别,传统的存储技术需要专门的介质库管理员和操作人员来管理文件系统或逻辑卷,接到请求时需手动安装介质,监视介质管理,以及对频繁出现的维护要求和机械故障提供支持。Centera 中的内容量可以大幅度增加,而IT 管理资源则可以保持不变。
Centera 持续不断地监视系统的健康状况。它可以自我修复,而且可以只发送与性能问题有关的报警电子邮件。这一功能既可以通过客户的内部电子邮件系统完成,也可以通过使用OnAlert™ PC拨号到EMC服务基础结构。
数据保护
为了给数据增加一层安全保护,对Centera 中存储的每一项记录可通过镜像方式进行保护,或通过奇偶校验来保护。不管用其中哪一种保护方式,都可以实施一种数据保护方案以防范潜在的灾难。万一某一物理存储单元变坏或发生故障,记录将仍保持可以存取,并且可以从镜像副本中恢复或从奇偶校验中重新生成
采用此方案的优势:
采用了SAN的架构,整合了HIS系统和PACS系统,选用EMC企业级磁盘系统,配合主机的集群,使在线业务系统的可用性和运行效率大大提高。
采用了SURESAVE虚拟磁带库技术,屏除了传统磁带库带来的机械故障率高、维护难度大、备份恢复效能低的缺点。
采用了世界领先的EMC Centera归档解决方案,利用Centera所具备的CAS内容寻址技术,将影象重复部分只做单一实例存储。大大节省了归档存储空间,Centera具备的强大扩充能力,也使得未来5年内医院的业务增长得到满足。
总结:该方案的特点,是将用户的信息从结构上分为:固定数据(PACS影象)和数据库数据(HIS业务),针对不同的数据类型,用户的不同需求,分别做了处理。使其数据库数据(HIS业务)运行在EMC企业级磁盘系统中保证业务连续性,并应用SURESAVE虚拟磁带库技术进行数据库数据(HIS业务)备份。而针对固定数据(PACS影象)的数据,采用EMC Centera归档方案,尤其值得关注的是:Centera所具备的单一实例存储技术,相同内容的数据只保存一份,每次归档将重复数据找出,建立索引,利用CAS内容寻址技术查找数据,从而使得数据空间得到释放,大大提高了数据缩减比例,最高可达1:20倍的数据缩减,这使得用户的总采购容量得到降低,不仅节省了投资,还减少了用电量和机房空间,达到了绿色环保的效果。