(连载)网络存储导论第五章:数据分级存储简介

    5.3.1 在线存储

     总体上讲,在线存储多采用高速磁盘阵列等存储设备,存取速度快,当然价格昂贵。在线存储一般采用高端存储系统和技术如:SAN、点对点直连技术、S2A 等。高端存储系统具有一些“高端”属性,比如,高容量、高性能、高可用性、冗余性等,现在存储工程师看到,这些特点已经不再是高端特有的了,许多中端产品也大都采取了这些设计。

     SAN 技术的高性能依赖于三个重要领域的性能支持:存储容量、计算能力和传输能力。在传统SAN 存储系统中,存储容量这一环节由于存储介质技术的快速发展已经得到了很好的解决。存储容量通过多磁盘容量的叠加已经能够达到数千TB 的水平。而在计算能力与传输能力两个环节上,传统SAN 却存在很多先天的弱点。最近在高端存储领域出现了两种新技术–点对点直连技术与并行存储技术。具体如下:

     点对点直连技术是EMC 近期推出的一种全新的点到点互联架构,在性能方面,由于它采用了点对点对接,消除了总线或交换机方式造成的延迟,专用的数据通道意味着不会出现交换机竞争的情况,减少数据从存储位置传输到目标位置的延迟。它还具有32 个独立高速缓存区,而且每个高速缓存区都具有独立的逻辑访问,可以为用户提供更强大的处理和访问能力。

     S2A 是DataDirect Networks 公司推出的并行存储技术。S2A 没有采用传统的光纤通道交换机的交叉矩阵交换机制,它所采用的高度并行端口技术消除了交换机制所带来的不可避免的时间延迟,能够持续不变地提供充满端口带宽的数据吞吐量。S2A 控制器内部的四个主机通道之间采用虚拟的并行体系结构,通过提供并行处理和并行数据读写的途径,使得在多主机的存储区域网络环境中具有非常高的不受多主机环境影响的使用性能。

     5.3.2 离线存储

     离线存储采用磁带作为存储介质,其访问速度低,但能实现海量存储,同时价格低廉。

     以前用户有这样的想法:反正数据存放在磁带上面,性能都不高,只要在灾难发生时能够使用它们将需要的数据恢复回来就可以了。其实,这是很不正确的。要知道,用户的数据越来越多,原有的数据也不能丢弃,当这些数据逐年累积以后管理它们就成了一件十分困难的事情,而且还要进行磁带定期维护的工作。

     因此,许多磁带库厂商在这方面进行了加强,提供了完整的数据生命周期管理,专为数据密集型SAN 环境而设计,尤其适用于高强度、大容量的数据访问和数据存储,减少了管理 SAN 数据的时间和成本,从数据生成到其生命周期结束,其中的每一步骤都提供了相应的功能。这也说明磁带库管理更注重“智能”。

     5.3.3 近线存储

     随着用户需求的日益细分,人们越来越发现原有的两级模式(在线与离线)已经不能很好地满足用户的存储需求,在这两个“极端”之间有大量的空白,于是就产生了近线存储的概念。近线存储的概念一产生就得到了厂商与用户的赞同,定位于此领域的产品很快就纷纷出现,形成了近一时期最为活跃的中间层。

     NetApp 推出的R100 近线存储设备,获得巨大成功,仅1 年时间在全球就拥有了100 多个用户,总部署容量超过3PB。

     Quantum 推出的基于磁盘的产品DX30,能够模拟各类磁带库,保留了与存储管理软件的兼容性,而又具有比磁带库更高的速度,用户可以先将数据备份到DX30 中,然后再转移到磁带上。

     以磁带产品知名的StorageTek 公司在业界较早提出了数据生命周期管理的概念,并拥有针对数据的不同生命周期提供的相应的解决方案,包括磁带设备和磁盘系统及软件产品,以帮助用户“将适当的数据,在适当的时间,存储到适当的设备上”。

     Legato 公司备份软件的最新版NetWorker7.0,引入了磁盘备份与磁带备份相结合的新方式,通过磁盘备份可以为用户提供更多性能优势。采用磁盘进行备份避免了一些磁带备份的弊端:磁带只能进行顺序读写,而且每盘磁带都需要完全倒回才可取出,加载卸载时间很长。磁盘备份解决方案还完全包括了“虚拟带库”的功能,而且可以在读一部分内容的同时进行写另一部分内容,因而可以实现了在设备进行备份时的恢复、搬移/克隆操作。