如何借助向外扩展型NAS应对大数据挑战

是不是为有望将贵公司的非结构化数据转化为实用的商业信息感到兴奋?你要做的第一步是建立可以处理PB级数据的存储架构。EMC Isilon公司的Nick Kirsch表示,向外扩展型NAS(网络附加存储)是最佳解决之道,他向CIO们着重介绍了向外扩展型NAS的五个原则。

由于企业力求进入大数据领域:对纸张文档进行数字化处理,并保存来往的电子邮件、Word文档、Excel文件及其他各种各样的非结构化数据,并希望从中发掘实用的商业信息,它们需要事先解决一个大问题:存储。

EMC Isilon公司的产品管理主管Nick Kirsch说:“许多企业突然积累了数PB的信息。他们面临着一个相似的挑战:面对这么多的信息,他们该如何充分利用?又如何用一种可扩展的架构来存储这些信息?”

一种可行的方案是垂直扩展(向上扩展)。此举旨在把现有的存储设备换成新的、容量更大的存储设备,从而使现有的存储节点容量更大、速度更快及/或功能更强。以这种方式整合存储基础设施颇有吸引力,因为这简化了管理,并减少了场地占用面积和耗电量。但这种方案并非没有问题:它不能轻松地横跨多个地点,天生缺乏很强的整体适应性,而且大容量高性能的存储设备很快变得成本高昂;处理不断增加的洪水般信息时,最大的问题是,现在的存储设备其容量只有那么大。

Kirsch说:“你可以建立越来越大的单一单元控制器。但到了某个时候,你无法建立更庞大的此类系统;只好添加第二个系统,最后可能需要管理数百个不同的系统。”

Kirsch表示,NAS方面走水平扩展(向外扩展)的道路是一条出路。向外扩展型NAS架构抛弃了价格昂贵、大容量的存储设备,改用成本低廉的大众化存储部件,并将它们合并到一个总存储池。你在必要时可以添加节点,而不是让节点变得更庞大。其缺点是,你可能很快面临一个极为复杂的管理环境。但是它可以横跨多个地点,而且天生具有很强的适应性。可能从管理大数据的角度来看最重要的是,你可以迅速、低成本地添加存储资源。

Kirsch表示:“我认为,说到存储,人们最大的抱怨就是,管理一个系统容易得很,但要管理两个或多个系统时,情况变得很复杂。”

Kirsch表示,就大数据而言,NAS比SAN(存储区域网络)更可取,因为SAN本来不是为非结构化数据和文件共享而建立的。为了让SAN与NFS或CIF/SMB等网络协议结合使用,必须在SAN前面部署文件服务器,这会增加管理复杂性,还会影响可扩展性。

向外扩展型NAS的五个原则

Kirsch建议CIO们应着眼于向外扩展型NAS架构的五个原则,第一个原则是力求简单:

易于扩展。Kirsch说:“CIO们考虑采用的下一代存储架构应该易于扩展。如果我有一只1TB容量的驱动器,我可以管理、保护和复制这个卷。为什么我就不能同样这么轻松地管理15PB的数据?不应该就因为数据量更大而导致管理变得更复杂。”向外扩展型NAS架构可以借助软件管理以及让多个节点如同一个系统工作的虚拟化/抽象层来解决这个问题。

可预测性。Kirsch说:“性能必须具有可预测性。”如果我这周增加了6TB,下周增加6TB,我希望性能方面有同样的线性扩展。我不希望非得重新为我的应用程序设计架构或重新培训我的用户。它应该完全以一种可预测的方式来扩展。我希望按需扩展、按需付费。别让我在今天投入过多的资金。我知道,按摩尔定律,下个月会出现速度更快的计算系统;驱动器的密度也只会越来越高。让我可以充分利用存储基础设施中的那些资源。另外,这应该是共享的对称架构。别硬让我了解你架构的差异。我只希望,需要时可以扩展该系统。

高效性。Kirsch说:“让我可以充分利用存储系统中的所有资源,无论它们在什么地方。让我可以充分地利用我那些物理磁盘驱动器,这些存储系统的利用率不是50%或55%,而是应该超过80%,无论处理器、计算部件或缓存在哪里,我都能充分利用这些资源。无论应用程序在什么地方运行,我都希望存储系统能最大限度地提升该应用程序的性能。另外要把分层存储功能(tiering)集成到该系统中。”换句话说,你需要把数据移到合适的存储系统,以便优化性能或优化容量。面向大数据的向外扩展型NAS要有足够高的智能化程度,以便为你自动处理这项任务。

可用性。Kirsch说:“该NAS架构必须随时可用。要充分发挥N-way架构的优势,好让我在遇到多次故障后可以存活下来。如果我环境中的某个机架出了故障,也可以恢复如初。我希望该系统随时可用;它要有灵活性。让我可以保障系统的可用性,又可以兼顾业务部门的需要。如果业务部门愿意投入更多资金,我可以提供更高的可用性。要是数据不大重要,我可以适当降低可用性。”归根到底,由于向外扩展型NAS存储基础设施建立在成本低廉的大众化硬件上,硬件可能会出故障,所以在设计系统时需要顾及硬件故障率较高这一点。

适合企业环境。Kirsch说:“随着技术日趋成熟,向外扩展型NAS不再是IT外面的那个次要项目,而是IT的一个重要组成部分。它要有快照、复制、配额及其他所有的传统IT功能。这项技术其实从高性能计算(HPC)发展而来的,但是如果你打算建立一个向外扩展型系统,最终建立的此类系统一定要适合企业环境。”