NAS的虚拟化部署方式以及评估六要素

NAS虚拟化广义上就是一种基于软件的解决方案,可以让你用存储池来管理不同种类的环境,不管你使用的是单机服务器还是集群服务器。当一台机器达到它的性能极限时,虚拟化软件自动把存储任务分配给在同一存储池中的另外一台NAS服务器或者文件服务器。有些系统会把文件分块之后分散到RAID系统中的不同服务器上,而当有新的RAID系统加入的时候,会把文件打散重新分配。

 

NAS虚拟化的基本含义

首先我们来说NAS,NAS服务器是一种易于采购、部署和使用的单用途设备。它把一台文件服务器和一个存储阵列集成在一个单一的整合设备上,也被称做网络附加存储设备。NAS系统以文件的形式展现数据,允许联合存储,这样连接在网络上的其他服务器也可以共享数据。NAS文件服务的简便性,深得IT经理们的推崇。对这些IT经理来说,管理一小部分NAS设备是很容易的事情,而管理后台复杂的繁多的存储设备则不仅很有挑战性,而且花费不菲。

存储虚拟化指的是用软件实现的一种物理实体到虚拟实体间地址映射的抽象层。虚拟化技术把磁盘组成的存储空间划分为虚拟卷。虚拟卷被操作系统当作物理磁盘来使用。虚拟存储层负责把IO请求从虚拟磁盘重定向到物理存储设备上。系统可以随时移动物理设备和更新虚拟到实体的映射关系。虚拟化技术让IT经理们在管理多块磁盘时就像在管理一个逻辑实体,而不用在磁盘群中针对每一块磁盘进行管理。而NAS虚拟化则提供了一种,通过少数的NAS设备来管理后端复杂繁多存储设备的相对简便的管理方式。

单一的文件系统要是想扩展一台服务器的物理性能,一般需要花费很多时间来做比较复杂的升级。而更简单一点的方法是另外配置一台服务器或者NAS设备。然而,管理员必须管理好每一台服务器或NAS设备,由于每一台设备都有自己独立的文件系统,需要特别注意文件系统和性能管理方面的问题。

这样的管理工作不仅仅花费巨大,而且效率低下,还给IT经理们带来了不小的工作压力,要合理地做备份,还要保护重要数据。而且,有些外存储器只支持一种存储格式,这就很难满足不同业务的需求,把不同的服务分层管理。

NAS虚拟化则可以降低总体拥有成本,回避复杂性,自动执行繁重的任务,使用现代化的管理,达到高性能的要求。

NAS虚拟化部署方式

NAS虚拟化将多个NAS设备聚合在一起作为一个设备运行。一种新的文件系统可以实现这种聚合,既可以替换原来的文件系统,也可以在现有文件系统之上。一个全局文件系统允许文件保留自己的名字空间。用户只需要访问一个文件系统就能访问到系统中的任何数据。所有被移动的文件仍然在它们原始的目录和路径里。

NAS网络存储作为前端存储网关接口集成后端存储资源与设备:既可以是同一厂商类似型号的服务器的集成,也可以是不同厂商不同类型服务器的集成。这种方式把多个NAS服务器上的所有资源全部虚拟化,整合设备为用户提供虚拟化的存储。但处理的响应时间可能会对性能有不良影响。

一个NAS网关作为光纤SAN的前端,允许用存储池的方法管理存储设备。有些网关还实现了跨设备的文件系统分配的文件容量管理。

分布式的虚拟化技术并不意味着每台服务器都需要附加层。这就取消了对非共享的虚拟化设备的需求,还能缓和某些时候和带内虚拟化技术有关的性能问题。在存储池中增加NAS服务器和增加单机服务器相比,企业会同时获得更好地可调节性能和更大的容量。这种方法更高效地把每个单台服务器的容量整合成一个无缝存储池。

这一类型的虚拟化是通过分布式文件系统(DFS)来实现的。DFS允许一个文件系统跨越所有DFS集群中的节点,并为所有文件生成一个统一的逻辑名字空间。这是一个任何用户通过任意一台服务器节点共享文件的环境。分布式服务器虚拟化一般使用常用的操作系统和硬件平台。

虚拟化产品不仅仅包括软件解决方案,还延伸到包括软硬件的完全系统。软件类的虚拟化解决方案装配在一个标准服务器上,相关的软件需要装配在聚合在一起的所有服务器上。通过这种解决方案,用户可以连接到存储服务器,而不受磁盘阵列品牌的限制。

一个完整虚拟化系统的解决方案包括一台服务器或外存储器,虚拟化软件和磁盘阵列。一个集成的软硬件系统是通过了厂商的完全测试的,并且可以为系统中的任意一个组件提供支持。

评估NAS虚拟化实现效果

虚拟化实现了灵活的动态管理方式以及存储卷的灵活分配。允许用户根据业务需要完全透明地扩大或缩小存储池,并根据用户策略在存储池内动态移动数据。NAS虚拟化产品在实现和功能上都存在很大差异。

用户最关心的五个特性–可用性、伸缩性、性能、可管理性和成本。对于NAS虚拟化,一般还需要有两个额外的评价指标,那就是连接性和易用性。评价产品最好的方法就是在实际环境中测评这几个特性。

可用性

用户最关心的就是数据和程序的可用性,可用性和可靠性是息息相关的。除了系统和路径的冗余以及故障跨越以外,数据的可用性还包括了热插拔,非中断管理,可重配置,自动故障检测、隔离和恢复,在线修复和故障后的完全系统恢复。

对于NAS虚拟化来说,下面是需要明确的问题:系统是否存在单点故障的可能?是否提供了自动故障切换的高可用性集群?磁盘/RAIN阵列是否可以在NAS前端间共享?是否使用了热备设备?有多少?

伸缩性

伸缩性是虚拟化软件产品需要具备的重要功能之一。伸缩性包括了容量、性能、可连接性,最好能不影响目前系统中正在进行的操作。

有关伸缩性的问题还可能包括:系统是否可以独立调节容量、性能和输入/输出子系统?是否可以在不影响用户的情况下,对带宽或者性能进行提升?系统是否支持不同种类的阵列?一个单一的文件系统是否可以透明地调整到多台服务器?支持多少节点和以太网端口?系统是否能满足长期增长目标的需要?

性能

用户希望通过实施虚拟化获得的最大收益就是性能的提升。可以通过类似实时负载均衡、动态路径重新分配等功能来达到不同等级的性能提升。与性能有关的问题包括:数据是否为负载均衡性能作了移动?处理器的型号、数量和速度如何?读写缓存的大小?是否支持服务器节点间文件的分块?是否自动执行负载均衡?可以集群多少台服务器?性能与节点数目之间是否有线性关系?

可管理性

存储管理是网络管理中投入资金最大的一块。在存储管理中的主要标准就是在网络上任意一点都有管理所有存储部件和服务器的能力。

可管理性包括了处理器配置,监控,负载均衡,诊断和报告机制。NAS虚拟化引擎可以集成和自动执行下面的操作:有没有对于多个NAS设备的统一管理?管理是集中的还是分布的?是否具有兼容性,也就是说,是否可以集成任何厂商的NAS设备,还是限制为一个厂商的系统?已经被打开的文件是否可以透明地移动?系统能否自动识别新增加的服务器和存储设备?是否可以用全局的名字空间?

成本

存储真正的成本并不是在于软硬件方面的投入,而是在管理存储的劳动和相关的生产力的损失。因此,需要考虑的总体拥有成本,包括了由于提升性能而带来的生产率的提高,管理的简化,更高的资源利用率,减少过度供应,提高数据的可用性。

需要强调的问题包括:解决方案是否是基于低成本的常用硬件?什么是总体拥有成本?系统是否包括了简化服务和最大化存储的软件?价格是否包含了可以共享、合并和保护数据的管理软件?

可连接性

可连接性包括了不中断现有业务而增加新设备的功能,延长连接距离,为多种平台和操作系统服务。在任意的连接中,每台主机都必须能够访问到网络中的任意一台存储设备。如果用了交换机,可影响连接性能的参数有端口的数量和每一个端口在全双工模式下连接到其它任意端口:系统是否允许与Windows,Unix,Linux和Apple平台相连接,而且操作系统能够无缝地共享文件。虚拟化产品能否使用现有的软硬件资源?支持什么类型的磁盘(ATA,SATA,SCSI,SAS,FiberChannel等)?是否能够使用第三方磁盘阵列?虚拟化系统能否与其它厂商的NAS系统聚合?解决方案是否能够使用现有的备份和复制软件?是否具有广域网的连接能力?

性能和管理问题一直困扰着一些已经上线的NAS虚拟化系统。对用户而言,虚拟化技术主要强调的是简化。虚拟化技术将管理整合,提升持续性能和分布存储的可靠性,更好地利用服务器,外存储器和存储资源,将成本优化,并加强数据保护。