用户采用分层存储的策略构建存储环境,不仅可以节约大量投资,还为各类存储应用带来极大的灵活性。目前,IDC(国际数据公司)对分层存储进行了详细的划分。
前些时候,记者采访了某省大型金融机构,结果发现,像他们这样的高端用户其实在存储方面的应用并不先进—-所有的存储设备就是一台高端设备外加一个磁带库。具体来讲,这台高端设备的存储容量为6TB,其中2TB容量为在线交易服务,另有2TB进行数据管理工作。据该用户的存储管理负责人介绍,随着数据量的不断增加,很快就要进行扩容工作。
仔细分析,用户这样的存储架构存在许多弊端:所有数据都存放在高端设备中,容量成本巨大;数据管理工作,比如数据分析、系统测试工作同时在一套系统中进行,势必对业务应用产生影响;一旦出现系统故障,从磁带库中直接恢复到高端存储设备需要大量工作时间,会造成长时间的业务中断,等等。
那么,有什么有效方法可以帮助上述这样的用户摆脱困境呢?就此问题,记者日前请教了IDC负责存储领域研究的副总裁John McArthur,Jonh回答说,其实许多方法都可以对此用户的存储环境进行改进,而最有效的方法之一就是实现分层存储。
分层存储的优势
海量存储器需要高成本,尤其在海量存储用于存储量很大的图像、视频应用时,这些对象的典型存储空间高达几十甚至上百兆字节。按一般规律,存储器的成本、容量和速度之间直接相关,越快的存储器或容量越大的存储器就越贵。只有在成本和效率之间达成平衡,才是现实的选择。
一般情况下,人们依据应用对存取速度和存储量的实际需求来选择存储介质的类型,从而使存储器的成本得以降低,这一方法称为分层存储管理。分层存储的基本目的就是将数据引入能支持这一对象需要性能的最低成本的设备中。
用户可以把数据按如下需求划分类别:基于性能、可用性、使用时间和存储成本的级别,其结果是降低了存储的总体成本,同时丝毫不影响业务需求。由于客户环境里的大部分数据相对而言是静态的(50%到80%),甚至很少使用,为什么还要把那些数据存储在一个采用了成本高昂的高性能驱动器的存储系统中呢?根据性能和可靠性分割数据,从而可以在主存储系统中管理更少的数据,按照这种方法,之前提到的用户,高端存储容量可以满足未来很长时间的需要。
IDC对分层存储的细分
IDC认为,对于分层存储解决方案,最关键的问题是总体可用性、性能可伸缩性、系统模块化、易于软件集成、存储设备互操作性和总体成本。确定特定企业的最佳选择依赖于许多因素,包括要控制的存储池的最终大小、要支持的应用程序的复杂性以及所需功能的级别。
目前许多存储系统供应商及他们的合作伙伴在分层存储领域提供了各种不同的选择,IDC密切跟踪了这一领域,同时对其进行了详细划分。
基于阵列的单个控制器
传统的解决方案在运行存储软件服务(如在这些系统上为所有磁盘进行虚拟化和复制)的单个存储系统上使用嵌入式控制器。这种方法适合于存储系统数量不多、连接到这些系统的应用也较少的环境中。
单个基于阵列的方法还有许多明显的不足,它们在异构环境中的使用受到更多的限制。根据具体环境的不同,这些不足还包括:有限的可伸缩性,管理的总容量和服务可利用的性能限定在对特定系统有效的容量和性能上;不具备可扩展性,像虚拟化这样的服务只能逐个用于系统,因此增大了复杂性,降低了有效性;没有充分利用资源,必须在每个系统上部署软件,不管那个系统的负载是否需要它;像数据复制这样的服务一般不能在其他类型的系统之间使用,无论系统是来自同一个供应商还是来自竞争对手。
独立设备
独立的设备运行高级存储软件(如虚拟化、数据复制、数据迁移),并驻留在服务器与存储系统之间的SAN(带内)上。这些应用程序的种类有很多,如带FC HBA的标准服务器、根据标准处理器特别配置的设备以及基于ASIC的设备或带有嵌入式FC 连接的刀片。独立设备提供高级服务,如为许多不同系统进行虚拟化,包括来自不同供应商的系统。
与这种方法有关的主要局限包括:尽管供应商可以运用集群技术来扩大规模,但高端产品的性能和可伸缩性仍然有限;任何设备的高速缓存和附加磁盘系统之间连接的丢失都可能导致数据丢失;由于数据包的开放和路由重选,以及维护每个存储系统的最新LUN位置信息,造成潜在的延迟。
智能SAN 交换机
另一种提供高级存储服务的方法是利用构建在存储网络核心的FC SAN 交换机内的智能。智能SAN交换机可利用端口级处理对某个存储消息的做出快速、智能的路由选择。这些决定包括LUN的虚拟化、同步数据复制,以及不同网络标准(FC 和iSCSI)之间的转换。
这种方法要求策略服务器和智能交换机之间存在一种通信机制。现在还没有一个用于通信的标准;因此,每一家软件供应商都必须设计与每一个主要FC 交换机产品协同工作的独立解决方案。集成到交换环境中具有减少必须管理的设备/系统数量的优点。它还使存储软件应用程序能够更快速地运用任何新兴的网络技术。
这种方法还有其他几个限制:万一交换机与设备之间出现故障,则存在潜在的数据丢失;由于数据包的开放和路由重选、维护每个存储系统的最新LUN 位置信息所引入的延时,以及安全完整性都是有待解决的问题;可能会出现一些端口超负荷运行同时另一些端口的有效性能却没有被充分利用。
网络存储控制器
管理分层存储体系结构的最新选择就是IDC 所谓的网络存储控制器(NSC)。这类新产品2004 年才开始进入市场,它利用了存储系统内网络技术的扩展应用,以便将某个驱动器和驱动器架连接到控制器上。NSC 是连接企业SAN(与服务器相连)和所有后端存储资源的设备。
能够在网络存储控制器内实现众多基于控制器的功能的能力,为用户在选择可提高总体容量利用率、改进数据恢复和以低成本进行持续存储资源管理的解决方案方面提供了更大的灵活性。新出现的基于NSC的解决方案必须:提供健壮的、完美集成的端口聚合、卷管理和通用数据复制功能,同时又不会带来安全性风险或数据通路上的延迟;确保部署选项的灵活性,同时又不牺牲各功能的一致性和通用性;以对当前操作最少的中断,快速并经济有效地进行扩展,包括能够在NSC上划分资源以满足动态的需求;与所有存储资源管理系统的有效集成;可跨现有存储系统和未来存储系统进行快速而无缝的数据迁移服务。
有两类供应商正在根据这种方法开发解决方案。一类由开发自己的NSC以及基于这些NSC的智能应用从头做起的企业组成。他们面临的主要挑战是确保与他们需要连接的所有类似的存储设备的兼容性,以及开发一套健壮的高级服务。
另一类由现有的存储系统供应商组成,他们正在开发或已经在他们的新一代存储解决方案中提供了作为关键组件的NSC。这些公司面临的主要挑战是开发更紧密集成的存储软件解决方案,而不仅仅是捆绑先前存在的实用程序和确保互操作性。