集群NAS的发展及应用

信息数据的爆炸式增长,导致企业用户的信息存储变得日益复杂。如何解决这个新难题?

据IDC的统计,在快速增长的信息数据当中,基于文件类型的非结构化数据的增速极快,全球存储市场的总出货量中将有80%的容量被文件级数据所覆盖。在经营活动中产生的大量信息,是企业的宝贵财富,必须像银行账户一样进行妥善保护。如何应对高速的数据增长,已成为企业用户面临的一个难题。

集群存储成为趋势

众所周知,NAS (Network Attached Storage) 技术是用来存储文件等非结构化数据的首选方案。在企业数据中心,NAS通过IP网络帮助用户实现了多服务器数据共享的功能。然而,由于业务和数据的大量增加,尽管单台NAS的最高容量已经达到了PB(Petabyte)级,但仍然难以满足要求。面对越来越多的数据,企业用户只好不断购买越来越多的NAS存储,这样一来,NAS存储就像以前的DAS (Direct Attached Storage) 和SAN (Storage Area Network)一样 ,形成了新的“信息孤岛”——多文件系统,多命名空间,多个挂载点。这给企业里的IT维护人员带来了不小的麻烦。

曾经有一段时间,NAS技术与SAN技术之间出现了激烈的争论,SAN要一统江山,NAS也要称霸天下。但随着时间的推移,由于越来越多的用户将注意力放在NAS或者SAN是否能够满足不同应用的需要,NAS与SAN最终形成了互补的存储解决方案,我们既需要NAS去存储Web、图片文件等非结构化数据,同时也需要SAN来帮我们存储结构化的数据(比如数据库)。NAS与SAN的融合显得顺理成章。

集群NAS,实际上代表了存储向集群化发展的必然方向。其实,不管是NAS还是SAN,这种不断向上扩展(Scale-up)的模式几乎已走到尽头。看看CPU技术,不也从不断地提高频率转变为增加内核吗?

集群存储最明显的优势就是灵活性。对于企业用户而言,用户可以根据当前的需要来购买存储。不管是多高的性能,多大的容量,用户都可以自由选择,可以按需购买,即买即用,而不是立刻花费高成本购买一台非常大的存储设备,大幅度减少了用户初期的建设成本。

集群存储的另一个优势是提供良好的可管理性。不管用户购买了多少个控制器,多少个磁盘,它们看起来还是一套系统。毋庸置疑,管理一套系统肯定比管理多套系统要容易些。

集群NAS的技术发展

集群NAS(Scale-out NAS),可以理解为横向扩展的NAS系统,区别于以前的向上扩展模式(Scale-up)。它有以下两种常见的技术实现方式:

集群架构:顾名思义,这种架构就是构建在集群文件系统之上的方案。该架构支持多个引擎节点同时共享一组SAN上的卷,同时能够提供一个全局的命名系统,这个系统能够通过负载均衡算法,将前端的访问请求平均分配到各个引擎上。这个文件系统还能提供一套文件锁机制,确保所有的引擎节点在同一时间可以访问到同一个卷上的数据。华为现已推出基于集群架构的N8000系列集群NAS产品,其各节点之间实现了工作负载均衡,集群架构和负载均衡的设计可以避免节点故障带来的风险,即使数据中心内的服务器发生故障,服务依然可以照常提供。

RAIN架构:即Redundant Array of Independent Node架构。由多个独立节点组成一个统一的NAS系统,每个节点有自己的计算和存储资源。RAIN架构的优点很明显,首先是独立节点本身的成本较低,通常基于X86的硬件平台架构,这意味着系统在扩容时不需花费太多;其次,每做一次扩容,就相当于对整个系统的计算能力、Cache缓存、存储空间等进行了提升,整个系统的性能提升相当明显;最后,从可靠性来看,只要不是所有的节点都失效,系统就是可用的。

实际上,这两种技术方式各有优劣。从响应时间上看,集群架构的产品具有一定的优势;从扩展性方面来看,RAIN架构优势明显。这两种技术若能长期发展,又能互相竞争,就能让Scale-out NAS技术不断地提高和完善。

近年来,集群NAS快速壮大,云存储技术同时也在不断发展。实际上,集群NAS的技术特点与云存储有很多的共同之处,集群NAS可看成是云存储的一个前传或子集,两者都因快速增长的非结构化数据而生,将存储设备与应用软件集合起来协同工作,也都是以一个整体系统对外提供数据存储和业务访问功能。所不同的是,云存储要大得多,云存储超越了传统的数据中心概念,跨越局域网、广域网和互联网,包含了网格技术、分布式文件系统等技术。

种种迹象表明,集群NAS的身影将出现在越来越多的数据中心里。未来,随着云存储技术的进一步发展,集群NAS将会逐渐融入到云存储中,成为云存储的一部分。

集群NAS的优势应用

传统的存储能够很好地适应交易型的应用,特别是数据库类型的基于块的应用。但是,随着近年来数字设备的不断普及,数字相片、数字视频等文件的大量产生,对各种存储的需求量随之激增。另外,网络应用特别是web2.0的发展,对存储的低成本和高扩展性提出了新挑战。传统的存储架构很难适应这些应用场景,集群NAS系统越来越受欢迎。一般认为,集群NAS较适合以下两种类型的应用:

web服务:Web服务包括大家所熟知的博客、社区交友、网上店铺等,这些用户往往对存储空间有较大的需求,这是由于在博客和交友网站中大量上传的数码照片、视频文件,网上店铺里琳琅满目的商品也都是数码照片、Flash动画等。每个用户需要的空间都在不断增长,同时有越来越多的用户不断加入。这些应用的存储需求与企业数据中心的存储需求完全不同,无法进行有效预测。所以,我们必须提供一种扩展性十分强大的存储架构,它能随着业务量的增长扩展到相当大的规模。毋庸置疑,集群NAS在这方面有着先天的优势。

文件归档存储:信息记录在纸质的票据上,既不利于保存,也不利于查找。随着高速的扫描技术及存储技术的不断发展,纸质票据电子化的应用越来越多,比如金融领域中大量的手填票据需要电子化,法院领域中大量的案件卷宗记录等。这类应用对性能的要求并不高,但是对容量的需求很大,对成本较为关注。集群NAS的大规模扩展能力能够很好地满足这个需求。

从目前来看,集群NAS的灵活性和易管理的优势,能够帮助企业用户应对非结构化数据的飞速增长。但是,集群NAS在某些功能尚显不足,主要体现在快照的管理和恢复,远程的复制容灾方案,多协议的支持等方面。

尽管集群NAS存在一些不足,但是我们仍然看到使用集群NAS的用户在不断地增加,集群NAS能够非常好地适应数据的爆炸式增长。