NAS实现数据整合

前言及NAS技术分析

本篇文章首发于《中计报》,文章版权&复制权属于中国计算机报

    随着硬件价格的下降,NAS将会向两个方面发展:在低端,主要特点是越来越专用,使用越来越简单,会通过软件实现iSCSI协议,来满足网络共享;在中高端,SAN势必是共享存储的龙头;要是在网络上实现文件共享,NAS则会成为一件强有力的武器。

    NAS(Network Attached Storage),译为网络附加存储、或者网络存储设备,它是一种专用数据存储设备,直接连到网络上,不再挂接服务器后端,避免给服务器增加I/O负载。NAS内嵌系统软件,提供跨平台文件共享,实现数据集中管理。

    NAS不但具有SAN的存储共享数据和集中管理的优点,同时由于它基于LAN的接入方式,具有接入方便快捷、成本低、兼容性好、管理方便等特点,进而大量节省用户成本; NAS已经逐渐成为企事业单位网络存储方案的主要选择之一。

    目前已有很多公司推出丰富的NAS产品,国外专业的存储厂商有NetApp、 Auspex、PROCOM、EMC等,他们逐渐成为中高端NAS产品的主要供应商,而国内外的很多服务器提供商,也先后推出了自己的NAS产品,攻打中低端市场,并逐步向中高端渗透。利用其成熟的存储技术和在服务器方面的经验和技术优势形成新的NAS竞争团队。

    由于NAS产品直接应用成熟的网络技术,使用可靠简单快捷,所以已经广泛应用到教育、科研、ISP/ASP、IDC、Web/E-mail、金融、保险、电信、CAD、医药、出版、印刷、音视频VoD点播等诸多领域。

    NAS技术分析

    NAS使用非常简单,通过数据网络直接向客户端提供文件共享。网络介质可以是局域网,也可以是广域网;理论上拓扑结构可以支持多种类型。

    NAS主要有两个突出特点:其一,物理连接将NAS直接连到网络上,不再挂接到某个服务器后端,避免增加服务器I/O负载;其二,技术上通过专用软件策略进行数据块调度,减少磁头臂机械移动的次数,克服由此造成的延时。

    图一说明NAS从结构上可以分解为控制器部分、网络部分、存储设备三部分;存储设备可以是RAID磁盘阵列,或者是磁盘和磁带;网络部分从理论上可以是各种网络技术,支持多种网络拓扑;控制器部分从结构和功能上讲都是一个有自己的CPU和自己的OS的瘦服务器,NAS实际上是一个专用的网络文件服务器。

    

图一NAS构成

    NAS作为专用网络文件服务器,具有文件共享服务的同时,强化了其“专用”性,在同等的配置下I/O性能高、管理方便,同时提高可靠性和扩展能力,特别是专门实现的跨平台的文件共享也是一般文件服务器不具有的。其专用的瘦服务器特性,是由NAS核心来实现,它增强了操作系统在存储设备管理和I/O处理方面的功能,提供管理工具来简化管理。下面从四个主要方面简单说明。

NAS核心操作系统

NAS作为一种专用服务器,就像路由器依靠其核心OS实现路由功能一样,NAS OS也是其系统“心脏”。

    

图二 NAS OS构成

    从图二可以看出,NAS OS通常需要实现四个方面的功能:1.设备驱动功能;2.设备管理功能;3.文件共享服务:主要是能够支持访问的客户端的类型,至少应该包括对CIFS协议(Windows系列平台文件共享协议标准)和NFS协议(UNIX/Linux平台的共享协议的标准)的支持; 4.应用系统:通常包括一个缩减的Web服务程序和备份引擎。

    目前,NAS OS的实现基础主要有三个途径:

    1. 以FreeBSD/Linux等通用网络OS为蓝本,进行系统重构而成。像 lenovo联想的SureNAS R系列、Procom的产品和NetApp的产品都是这样的产品。

    2. 以Microsoft 的SAK为基础,定制开发而成。像IBM 和 Dell 的大部分NAS产品和lenovo SureNAS100系列NAS产品等。

    3. 基于VxWork等高效嵌入式操作系统开发而成。只有少量高端产品才采用这种方法。

NAS存储设备及文件系统

目前主流的存储技术在NAS中都有应用。在SAN中采用的FiberChannel技术和Fabric交换技术在高端NAS产品也占有很大的比重,由于其成本较高,在中低端几乎没有选用。未来的联想高端NAS或NAS网关,将会采用FC技术或者集成支持FC设备。

    SCSI技术是在中端和部分高端NAS广泛采用的技术,联想即将推出的SureNAS 400和800就是采用高效的SCSI技术。

    早期的NAS主要从中高端推广继承,采用的主要是SCSI RAID技术;随着CPU性能提高和新技术的出现,IDE技术在低端NAS成为主流选择;其性能、可靠性和易用性都不逊色于SCSI,但是总体拥有成本却大大降低。联想日前上市的低端网络存储SureNAS100、SureNAS 104R和208R就是采用IDE技术的高性价比产品。

    网络设备

    虽然NAS理论上可以支持各种拓扑结构和网络协议,但是,由于以太网技术是目前最普遍的一种局域网技术,特别是快速以太网络技术,数据传输率已经达到了1Gbps,且正在推出10Gbps的标准和技术,这些都确定了以太网技术的霸主地位,因此以太网是NAS设备通常采用的技术;联想 SureNAS系列都全面支持以太网技术。

    网络是NAS对外数据共享的唯一通道,其性能和可靠性要求都非常高。高端NAS会采用一些关键技术来提供网络可用带宽和容错,而部分低端NAS也采用了这些技术。联想的SureNAS R系列的双以太网络接口可以通过Trunking来实现双网口绑定、提高网络带宽;同时支持网络接口间的Failover,提高网络的可靠性和可用性。

文件系统

NAS网络文件服务器采用的文件系统对效率、可靠性、容量、容错能力都要求苛刻。不同层次和核心的NAS采用的文件系统也有所不同。

基于SAK开发的NAS内部采用的文件系统基本上都是NTFS, 它具有较强的安全级别、容量和性能,并且能够与Active Directory很好地集成。基于FreeBSD/Linux开发的NAS OS通常采用缺省文件系统,像FreeBSD的UFS、Linux的ext2/ext3等。

面向高端的基于FreeBSD/Linux开发的NAS OS和基于VxWorks的开发的NAS OS,一般采用日志文件系统,其原理来源于数据库处理中的事务处理,具有很强的故障恢复能力。像Auspex、NetApp等公司的NAS采用的文件系统都有日志功能;lenovo联想即将推出的SureNAS 110全系列采用日志文件系统。

NAS发展趋势及选择指南

NAS发展的初期主要是面向高端市场。随着计算机硬件价格的下降,NAS设备使用遍及了高中低端市场。NAS将会向两个方面发展:

    在低端,主要特点是越来越专用,使用越来越简单,会通过软件实现iSCSI协议,来满足块设备级的网络共享;在中高端,SAN势必是共享存储的龙头,在网络上实现文件共享,NAS会成为一个强有力的NAS控制器,同时会实现对iSCSI的支持,以其低廉的客户成本发挥SAN的集中存储和共享功能。

    如何选择

    对于高端NAS的选择,应该选择能与SAN实现融合的产品,发挥SAN和NAS的共同优势。对于中端NAS的选择,要选择基于SCSI技术或FC技术的产品,根据自己应用选择是基于SAK还是基于UNIX/Linux开发的产品。对于低端NAS的选择,除非特殊需求,选择基于IDE的NAS会有较高的性能价格比。至于NAS核心系统的选择要根据应用决定,特别要注意辅助的管理和使用工具是否完善。