直击高端磁盘阵列系统

前言、RAID从SCSI到IDE

存储虚拟化是目前存储界提的最多的名词之一,在整个存储虚拟化的工作进程中,有一项技术功不可没,它就是RAID。1980年RAID的出现,将存储虚拟化带进了一个新的时代。从此以后,RAID也在不断发展,渐渐被人们所熟悉,并渐渐的让人们离不开它了…… 按照存储技术的现状,存储的虚拟化应该分为三个层次,即服务器层、存储器层和光纤互连层。在服务器层的存储虚拟,也就是在DAS范围内的虚拟,一般采用常用的RAID技术;在存储器层既可以是带库也可以是阵列系统,虚拟化只依靠单独的子系统便可以完成,比如在带库实现的RAID,在光纤互连层将所有的子系统进行统一的虚拟化。

    2000年全球外部RAID存储系统市场增长28%,实现销售额215亿美元。其中,应用在UNIX系统中的外部RAID市场增长约40%,Windows NT的外部RAID市场增长74%,实现销售额59亿美元。

    RAID从SCSI到IDE

    磁盘阵列(RAID)技术自产生以来似乎就被定义在了高端“贵族家庭”,它的传统接口一直使用的是SCSI。这种接口可以说是服务器产品的“专利”,由于它在过去的一段时间里和传统的桌面系统使用的IDE接口相比具有明显的速度优势,所以具有SCSI接口的硬盘要比传统的IDE硬盘贵许多。使用基于SCSI的RAID系统,在较大的阵列系统中,随着硬盘的数量增多,整体造价就明显地提高。与此相反,可以看到被视为低端产品的IDE硬盘却具有明显的价格优势,近年来随着IDE接口标准的升级,从UDMA33到UDMA66,再到ATA100,可以说,IDE的传输速度有了明显的提高,串行ATA又可加大IDE硬盘连接数量,于是RAID产品逐步开始渗透到了所谓低端的IDE硬盘领域。

    另一个角度来看,RAID强调的是多磁盘的阵列组合应用,IDE由于通道的数量限制,每个通道最多能够使用两块硬盘,而且有主次之分,不能真正实现数据的阵列存储,这也严重地阻碍了在IDE上使用RAID技术。针对IDE的速度提升和所面临的通道问题,几家相关的厂商都相继发布了自己基于IDE接口的RAID板卡,但由于技术问题,一直停留在原始的单通道多硬盘的基础上。

RAID风光依旧

由于RAID技术已经很成熟,很多产品都是基于RAID的,而且新的RAID上的技术应用也在不断开发出来,比如许多存储设备厂商都开始在磁盘阵列、磁带驱动器等设备上增加2GB的接口。RAID依然是人们关注的焦点,风光依旧。 昆腾公司基于磁盘的产品??Quantum DX30,建立在昆腾公司的“适配磁盘阵列管理技术(ADAM)”平台之上。DX30是一种基于磁盘的高密度增强型备份系统,通过将RAID保护磁盘与备份数据路径相集成,能显著提高备份及恢复时间,并有效增强在备份窗口内成功实现备份的信心度。

    惠普公司的Surestore磁盘阵列XP512存储产品是惠普的旗舰产品,它是第一款为企业和服务供应商提供的高端存储解决方案,主要面向灾难恢复、地区数据中心或单应用环境中的客户。XP512磁盘阵列最多可配置512个磁盘,总容量可达24TB(兆兆字节),在交换式SAN的配置下,所支持的主机连接数可达928个。此系统建立在智能存储结构的基础之上,在内部用一个6.4GB/s的纵横开关(crossbar switch)和32GB完全镜像的高速缓存为用户提供可扩展的互联能力。XP512在性能方面支持RAID0/1与RAID 5,优化了存储的性能;为了确保无论在何种情况下写到XP512的所有数据都是安全的,XP512还具有电池保护的镜像写高速缓存功能。

    Adaptec的两款RAID板卡是ATA RAID 1200A和ATA RAID 2400A。其中ATA RAID 2400A具有四通道,能够同时连接四块IDE硬盘,而且硬盘之间不存在主从关系。对于RAID来讲,用户经常用到的是RAID0(磁盘队列)、RAID1(磁盘镜像)、RAID0+1、RAID5(异或校验)三种标准,RAID0单独使用没有冗错备份保证,RAID1和RAID0+1由于要做完全的备份所以比较浪费硬盘,RAID5是利用了异或的逻辑校验,实现了N-1块硬盘的利用率,并且能够实现在任何一块硬盘数据丢失的时候进行逻辑恢复数据。但是,RAID5最少需要3块硬盘,这对IDE硬盘是一个挑战。ATA RAID 2400A是业界第一款能够支持RAID5的板卡。ATA RAID 2400A内置的处理器速度已经达到了100MHZ,并且支持ATA热插拔,在管理方面首次实现了Storage Manager Pro的图形界面管理,并可以支持多种操作系统,比如LINUX和SCO UNIX等。ATA RAID 1200A是一款低端的产品,由于没有内置处理器和内存,所以它的价格非常低,适合低端市场,不过它只有两个通道。

    清华同方光盘股份有限公司的NAS磁盘阵列具有2个EIDE接口和1个Ultra Wide SCSI接口,允许挂接4个EIDE设备和15个SCSI设备,其最大阵列容量高达1.3TB,最大内存可扩展到256MB。NAS磁盘阵列是一种可通过集线器(Hub)和交换机(Switch)等设备直接连到网络上的网络存储设备,由于采用了以“数据为中心”的存储结构模式,因此相对传统的以“服务器为中心”的存储结构模式,提高了文件的访问速度,减少了网络堵塞,降低了主机I/O负担。清华同方NAS磁盘阵列的最大特点是可实现数据的分布式存储和集中管理。随着用户数据量的增大,用户会使用几个、甚至几十个NAS磁盘阵列,并将这些NAS磁盘阵列分散放置在对其访问频率最高的网段上。该设备的核心是一个带专用瘦服务器的RAID控制器,在其上集成了EDIE、SCSI和网络接口,并将在嵌入式Linux操作系统基础上开发的各种应用程序和存储管理软件置于高速闪存内,使系统稳定可靠。同时,它具有一个10BaseT/100BaseTX以太网络接口,并预留有PCI扩展槽,可扩展成1000M网络接口。

RAID后有追兵

康柏的Virtualized Array(虚拟阵列技术)可以说是RAID的接班人,与RAID相比它具有更大的优势,它适合高端开放系统的用户,使用了全光纤通道体系结构,能够满足对数据输入输出性能和可扩展性能有较高要求的用户,并能够兼容包括Solaris、VOMS、NT等多种操作系统。Virtualized Array将子系统内的所有硬盘当作一个统一的存储空间看待,不管将来要做几个阵列,都平均分摊到每一个系统内的物理硬盘上。整个系统中的硬盘数量可以任意进行改变,数据的存放可以随着组的调整而调整,是动态的。Virtualized Array使用了分布式校验技术,在每个磁盘组里预先分配空间,当磁盘组里的物理硬盘失效时,可用来恢复数据。

    Adaptec的iROC技术(RAID on Chip)实质上就是利用SCSI控制芯片内部的RISC处理器完成镜像功能。由于RAID 0、1和0+1需要的运算量都不大,简单的RISC处理器就能胜任。在Firmware的配合下,通过iROC实现的RAID 0、1或0+1具备引导能力和对热交换、热备盘的支持,还可通过Adaptec存储管理软件进行远程管理,这些都与纯粹的软RAID不同。在入门级和1U高度的机架式服务器中,主板上通常会集成SCSI控制芯片但不标配独立的RAID卡,iROC的出发点就是让这些系统具有基本的硬件数据保护,当需要更为复杂的RAID 5时再购买独立的RAID卡。RAID在需求上受到了严峻挑战。