RAID与存储技术在档案信息化建设中的选择

《全国档案事业发展“十五”计划》提出,档案信息化建设是今后—个时期内档案工作的重要奋斗目标和主要工作任务,是档案工作发展和改革的需要,是档案工作的发展和改革的可靠物质基础和条件。俗话说,“兵马未动粮草先行”,档案信息化建设的基础首先是设备的投入建设。在当前信息化不断发展的社会,设备的投入,首先是服务器和存储设备为先的计算机设备的投入。档案馆信息化建设目标是宏伟的,主要是实现馆藏资源数字化、档案信息结构标准化、数据传输网络化、生成空间虚拟化、信息利用全员化和档案管理自动化等。要实现这些基本的目标必须保障档案信息化基本设备的安全可靠运行。因此,档案部门需要合理地对已有和将购买的存储设备、服务器采用的RAID技术和存储技术作出合理选择。

一、RAID技术

冗余磁盘阵列技术1987年诞生于美国加州大学伯克利分校。RAID是“Redundant Array of Independent Disk”的缩写,意思是独立冗余磁盘阵列。简单解释,就是将若干个硬盘通过RAID控制卡组合成虚拟单个大容量的硬盘来使用。硬盘RAID技术,大大提高了硬盘容错性、可靠性和存储速度,提高了硬盘的存储能力。

RAID规范主要包含RAID 0-RAID 7等数个规范,它们的侧重点各不相同。在所有的级别中,RAID 0的速度是最快的,但没有冗余功能的,如果磁盘损坏,则所有的数据都无法使用。RAID1硬盘支持“热替换”,镜像硬盘相当于一个备份盘,在所有的 RAID级别上来说是最好的。RAID 5是分布式奇偶校验的独立磁盘结构,RAID 5的读出效率很高,写入效率一般,允许单个磁盘出错。RAID 5也是以数据的校验位来保证数据的安全,任何一个硬盘损坏,都可以根据其他硬盘上的校验位来重建损坏的数据,以允许容错—个硬盘,有三个以上硬盘可以使用 RAID 5技术。RAID 6与RAID 5相比较,可以允许两个硬盘出错。

二、RAID和存储技术在档案信息化建设的选择

在硬件RAID未出现时,以软件为主的RAID是唯一选择。其实在性能方面,RAID 0及RAID 1并不需要太多的系统资源,但在重建出现故障的RAID或是碰上大量运算资源的RAID 5,软件RAID未必是一个良好的选择,加上软件RAID依赖操作系统先启动,所以操作系统并未能受到有效的保护。为了解决这个问题,现在的服务器一般都配有阵列卡。通过该阵列卡,操作系统可以得到比较好的保护。阵列卡一般有5个左右的槽位,可以根据需要槽位上的硬盘分别用RAID 0、RAID 1或RAID 5方式做出处理。档案部门在购买服务器的时候,最好先了解服务器在这方面的一些性能参数。在实际工作中,经常会碰到的问题就是需要把原来的磁盘RAID 0方式转化为磁盘的RAID l或RAID 5(原来只购买了一个硬盘,或者安装时选择了RAID 0方式,而系统已经安装好),这个时候需要一定的技巧转换,对阵列卡的配置操作都是不可逆的,一定要非常小心。在阵列卡的配置操作前,最好对系统做备份,备份文件放到移动硬盘上。

磁盘阵列是档案馆信息化建设过程中—个很重要的硬件设备,它是档案部门专门存储电子资源的设备。磁盘阵列的磁盘处理方式通常有RAID 0、RAID 1、RAID 5和RAID 6,用户可以根据自己的需要设置RAID模式,串列块大小和RAID阵列所使用的磁盘。其中串列块大小最好用默认的Optimal。RAID阵列所使用的磁盘可通过光标键一添加。一般选择RAID 5或RAID 6模式来处理阵列中的硬盘。

磁盘阵列依据不同的技术模式,大体上可以分为三种:直接连接存储、网络连接存储、网络存储SAN。直接连接存储,也叫总线连接存储,简称DAS,是传统的存储模式,是以服务器为中心的存储结构。在这种结构中,存储器与服务器之间通过传统的I/O总线通信,服务器起到存储转发数据的作用。各种存储设备通过IDE、SCSI等I/0总线,借助服务器连接在网络上。客户端通过服务器访问存储器上的数据。如果选择直接连接这种存储模式,那么还需购买一个连接磁盘阵列的SCSI卡安装在服务器上。SCSI技术发展至今,可用的SCSI控制器的类型相当多,SCSI控制器接口通常有50针、68针和80针,常用的是50针和68针。SCSI卡是一种提供一个或—个以上(—个接口通过电缆可连接15个SCSI设备)的SCSI接口内置板卡,它可插在服务器(或其他设备)主板上的普通PCI(或服务器上的PCI—X或PCI—E)插槽上,实现多个SCSI接口的提供,以方便多个SCSI外设的连接。用这种方式 SCSI卡性能很重要,购置一个稳定SCSI卡可以保障磁盘阵列和服务器稳定进行数据通信。此外,正确配置SCSI卡的参数也很重要,如果主板配置给 SCSI卡的ID号不正确,则会出现磁盘阵列的数据不能正确读写,或者出现两个硬盘的情况(实际上在操作系统里应该只看到一个硬盘,在磁盘阵列做了 RAID 5以后)等奇怪现象。

网络连接存储简称NAS,是一种可以直接连接到网络上提供文件级服务的存储设备。它有效地通过自带的、简化的操作系统,将相关的硬件和软件集合在一起,用以提供文件服务。客户端可以在NAS存储设备提供的目录或设备中进行文件级操作。档案馆信息化建设过程中也可以采用直接连接存储NAS这种比较简单可行的方式。这种方式磁盘阵列不需另外服务器管理它,直接可以接上网络。但这种存储方式有两个安全陛问题需要注意:①当处于网络中的两个实体建立连接或传输信息时,对方身份的合法性要进行确认;②确保所接受,发送信息的安全性,保证用户口令及传输的各种信息不被非法用户中途窃听、篡改。

存储区域网络简称SAN,是指独立于服务器网络系统之外的高速光纤存储网络,采用高速光纤通道作为传输媒介,通过光纤交换机将服务器与存储设备相连底层使用光纤通道协议进行数据传输,网络中的主机通过光纤交换机访问网络中的各种存储设备。在SAN中存储设备不再是某个特定主机的附属设备,而是相互连接形成存储网络系统,同时向多个主机提供服务。在SAN中,用户可以自由增加磁盘阵列、磁带库和服务器等设备,用户存储空间和处理能力的需求可以不断扩大。另外,SAN具有更高的连接速度和处理能力,随着光纤通道技术在不断地发展,传输速率由以前的1Gbps、2Gbps提升到今天的4Gbps。SAN 存储根据采用的协议不同分为FC SAN和IP SAN两种技术。档案部门在有条件的情况下也可以采用这种模式。SAN存储技术在档案馆信息化建设过程中原则上设计方案须满足数据高安全性、高可靠性、高可用性等三个基本要求的特点,支持在需要的时候可以增加存储网络中的相关设备能力如硬盘,可以适应未来的网络结构拓展和容量增加。考虑到设备故障给未来系统运行带来的不可预知的影响,在整体网络设计中应采用冗余结构,关键部件应采取冗余结构,部件可以全部做到在线更换设计;数据通路利用软件功能配合硬件的双链路设计。存储系统管理对每台主机的双链路做出统一管理,自动侦测链路完好性,一旦链路出现故障在没有用户干预的情况下可以自动切换到正常的数据链路上,保证数据访问的实时性;另外,还应具备数据流量的负载均衡能力,在每台主机可用的数据链路中根据不同的策略,如应用程序的优先级别.每条链路的队列长度等,从而充分利用双数据链路连接的优势。根据不同应用系统数据量的需求进行SAN存储空间划分,存储阵列硬件配置有主机柜和扩展柜,存储阵列之间使用 LVM Mirror(卷管理器)的数据镜像方式来实现本地冗余数据备份,并配置硬件虚拟磁带库来提高数据备份性能,最终数据可通过磁带库使用磁带备份介质进行异地保存。

三、RAID和存储技术在我馆档案信息化建设的选择

我馆在档案信息化建设过程中和许多兄弟学校一样,面临经费不足的情况。在有限的经费下,购买适当的设备,选择适当的RAID和存储技术对我馆的档案信息化建设有着重要的意义。目前,我馆服务器上有三个硬盘,采用RAID 0和RAID 1混合模式,其中RAID 0模式1个硬盘,RAID l模式2个硬盘,平时正常运行时是RAID 1模式2个硬盘,RAID 0模式1个硬盘作为RAID 1模式2个硬盘的脱机的系统备份。磁盘阵列采用RAID 5存储技术模式,服务器配置60针的SCSI卡(PCI—E)和ESATA卡,分别连接多个不同磁盘阵列。

RAID技术和存储技术在档案信息化建设的选择应用,需要不断进行一些探讨,并在实践中不断进行检验和修正;同时档案部门在档案信息化过程中要因地制宜地建设,量力而行选择合理的存储设备,以保证档案信息化建设顺利进行。