珍惜这黄金时代吧:存储体系将退居幕后

我们必须正视新时代的降临,并为之做好准备。存储阵列即将在今后几年中迎来重大变革,因为存储内存将夺得主数据存储的统治地位。

这是一道明确的分界线,如科罗拉多大峡谷般将个位数TB和“存储”(双位数TB和多PB磁盘驱动器阵列数据)之间的服务器内存一分为二。主数据是服务器应用按需所需的数据,现在已经率先领略到了新时代的无限风光。

从传统角度来看,这些数据保存在磁盘驱动器阵列,阵列中包括由高成本高速度或者低成本低速度的多个存储层组成,分别用于保存使用频率最高和相对较低的数据。尽管这两类阵列方案由于SSD的加入而在速度上取得突破,但其本质却没有发生变化。目前最新的技术进展要数全闪存阵列的出现,这套机制并不会将闪存模块视为磁盘,数据交付速度也远远高于磁盘驱动器阵列。

我们正面临这样一个新时代,对访问延迟较为敏感的应用(例如VDI)需要将主数据从磁盘驱动器阵列迁移至全闪存阵列当中。

但从十年甚至二十年的长远角度来看,当下这些主数据存储领域的变革只能算是小小的中转站。发展的终极目标在于将主数据存储彻底从阵列中剥离出来,或者说完全抛弃为我们所熟知的“存储”概念。这一目标符合计算工作的根本需求,自然也引发了Fusion-io、惠普、SAP与HANA、Violin Memory以及希捷/Virident的新一轮角逐。

下面摘录的内容来自2013年1月10号惠普公司所发布的《惠普专为内存内计算打造的全新卓越中心》一文:

随着新技术与新型数据合集的不断涌现,所有数据密集型、事务处理型及分析类应用程序都将迁移至内存内计算环境当中。

自从SAP的HANA项目启动以来,惠普一直在基准及解决方案的创新工作中走在世界前列。惠普针对全新卓越中心打造的第一份里程碑式路线图就是一套专为基于HANA的SAP ERP及SAP客户关系管理(简称CRM)应用量身打造的单镜像开发平台。这一代号为Kraken的平台项目可以看作是让大型内存系统在未来进入实际应用领域的重大先驱。

应用在运行中会将全部数据放置在内存当中。目前这类存储环境是由DRAM与NAND构成的巨大地址空间,其中的数据在接受访问时会被视为常驻内存中的字节、块或者页,而非被保存在直连附件、网络附近或SSD当中的数据块或文件。非主机操作系统的I/O子系统会介入到数据的访问过程当中;这种内存级访问活动速度相当之快,而应用根据当前I/O的实际状况可能获得两倍、三倍、四倍、五倍、十倍甚至二十倍以上的运行速度提升。

由NAND打造的存储内存在特性上与传统内存完全不同,它不存在易失性,即数据不会在掉电或关机后旋即消失,启用系统后数据将随时听候调遣。但即使未来存储内存技术成为主流方案,NAND恐怕也不会真正上位。借这一良机脱胎换骨的很可能是其它后续技术,比如电阻式RAM方案(例如惠普采用的忆阻器或者Phase-Change Memory)。但这仍然算不得颠覆性的进展,此类方案无非是希望让存储内存变得更快、更密集且价格更低廉。

作为应用的工作集数据,主数据已经开始了自己的迁移旅程;一路向网络磁盘艰辛跋涉、在网络闪存中暂时作停留——但一切的终点、宿命的归属只会指向服务器中的存储内存。无论是整体而是某些字节,复制工作将由存储内存处理,这种高速传输效果正是故障恢复工作所必需的核心特性。

而作为参考对象,那些使用频率不高、对速度无甚要求的恢复副本等次级数据则将继续留在磁盘驱动器阵列当中。对于新时代下成长起来、每天与闪存存储相伴的年轻IT管理员们在面对一屋子磁盘狂转猛响时,其心情可能与我们现在面对磁带库的状态完全相同——陌生而诡异。

这些重大变革可能寄身于公共云或者企业数据中心之中,并以服务器应用为起点一步步向存储内存发生转化。虽然某些数据传输方案仍然具有一定价值,但现在那些复杂无比的备份、快照、RAID以及复制方案都将得到大幅度简化。到那时,存储将分为最基本的两个层面;存储内存打理使用频率较高的服务器数据,磁带归档则应对最冷门、访问量最低却又需要保留的数据。这就是近线与离线两大存储层面。

存储将不再成为数据中心IT团队的首要关注目标。融合系统将只由两大基本部分构成:搭载存储内存的服务器与网络。在服务器与网络两大主体之外,存储体系将退居次席,地位类似于汽车中的油箱。大家会把注意力集中在驱动结构、发动机以及变速箱身上,而油箱则必要却不再重要。汽车需要油箱,但相关技术只存在于幕后且不值一提。

存储面临的最大难题就是速度缓慢,而这一难题根本无法解决。告别访问缓慢噩梦的惟一办法是将所保存的数据一股脑拿出来,并放在内存当中。今天的各种热门方案必将逐渐成为未来的陈旧古董,而我们则应该热爱这个瞬息万变的时代,共同在存储归于平淡的同时迎来更加辉煌的明日科技。