NVMe市占率攀升,浪潮存储的应对之道

来自中国闪存市场的统计显示,2018年全球SSD的出货量达到2.05亿块,比2017年增长31%,预计2019年总出货量有望超过2.5亿台。三星、SK海力士、英特尔及美光、东芝及WD等国际巨头,正在投入96层高容量3D NAND出货。

而浪潮存储2018年SSD整体出货量超过百万台,速度较2017年有150%的增长。8月23日,浪潮存储资深技术专家王杰华在杭州举行的2019全球闪存峰会(Flash Memory World)上透露,2018年,浪潮SSD的客户70%为数据中心,仅有30%为行业客户,但在2019年,行业客户已经上升到40%。

这意味着,SSD已经从领先者的数据中心市场,渗透到了向电信、金融、能源等通用行业市场。

浪潮的介入,使原本激烈的SSD市场竞争更加白热化。

深度分析结果显示,浪潮SSD产品的应用分类在2018年有35%是NVMe,65%为SATA。王杰华在题为《SSD与企业系统的应用和融合》的演讲中预测,2019年这个比例将各占一半。

也就是说,NVMe市场占有率仍将持续攀升。

浪潮系统级和部件级两方面应对措施

针对NVMe市场占有率仍将持续攀升的市场趋势,王杰华指出,浪潮分别从系统级和部件两个方面来应对。

在部件级,浪潮经过三年研发推出了全自主软硬件设计的NVMe SSD,它支持最新协议NVMe1.3,提供一个标准2.5寸单双端口,容量从2TB可扩至32TB,规格支持64层(标准版可升级到96层),整体擦写次数提升40%,寿命更长。

得益于一些相关的软件平台,浪潮还可以根据客户的要求提供类似随机读写性能的灵活定制,安全、功耗、支持备份等方面也都满足客户数据方面的要求,达到了业界一流的水准。

在系统级,浪潮全闪存储G5基于一套架构实现NVMe和SAS全支持,未来还可支撑NVMe Optane,在内存和NAND之间增加新的性价比Tier;采用超高速PCIE 3.0互联架构,最大可扩展48个控制器,可实现6个9的可靠性。此外,浪潮全闪存储G5具有独特的异构虚拟化技术,可以异构业界Top10厂商95%以上的主流存储型号,且异构存储数据迁移无需停机,实现业务无中断的全闪存储切换,也可支撑存储双活或提供两地三中心解决方案。

浪潮SSD的两大系列

目前,浪潮自研SSD产品有高端和主流两个系列。

高端SSD容量包括1.6TB、3.2TB、6.4TB,3DWPD规格,接口15毫米的厚盘2.5寸,AIC卡,采用64层NAND,与业界顶级产品完全看齐,其保守的功耗数据为7-25W,实际上最大功耗低于21W。

高端系列将于年底前上市。

在主流SSD方面,浪潮主打容量为1.92TB和3.84TB规格,1.2DWPD,NVMe协议升级到1.3,NAND将支持到96层NAND。

主流系列将于明年年初上市。

浪潮SSD:三个发展阶段演变

回顾三年来自身的SSD发展历程,浪潮总结为三个阶段:从性能、功能到业务融合。

在性能方面,NVMe将NAND和PCIe结合在一起,推动性能大幅度上升,将SSD引入性能竞争赛道,迫使友商不得不拉升各种性能标杆。

为了性能,浪潮自研SSD做了大量工作,主要分享两个技术点:

一个是针对大容量(8TB以上)SSD进行特殊散热优化。大容量SSD的PCB通常采用叠层设计,当PCB折叠后,上表面和下表面都跟外壳接触、解决部分散热问题,但中间层没有散热片。浪潮采取在中间加入一个微槽道散热器贴近内表面上下两层的NAND传导热量,并通过SSD中间风道排出多余热量。这种方式能够降低NAND表面温度8摄氏度左右,优化幅度达到20%。

另一个称为”场景化的动态闪存管理算法”,是浪潮联合世界顶级NAND专家创新设计的NAND特性自学习算法模型,目的是提升固态盘性能、延长NAND寿命。

要对NAND基本特性进行分析,就需要将SSD盘运行期间的擦除次数、读计数、保持时间、温度等若干指标分解成不同场景。为此,浪潮先后测试了500多个NAND颗粒,原始数据超过1TB,经过各种优化和算法形成的初始NAND特性数据超过200MB。将这些场景数据输送到中间算法中,然后参考初始特性数据,就会得出不同场景下,不同擦除次数、不同读计数、不同的温度等情况下最优的读取电压。

这是一个动态的调整过程。经过一系列完整的算法运行后达到两个效果。一是把整盘NAND寿命从7K P/E提升到10K P/E,提升40%,这意味着未来SSD盘寿命更长,而对客户来说使用成本更低,二是保证SSD生命末期时QoS不会下降。

在NAND技术成熟、NVMe协议越来越完善之后,功能就取代性能成为第一考虑要素。

在功能方面,浪潮一方面实现了全闪盘控协同生命周期的管理以及非中断的业务升级。为了适配SSD变化,全闪系统对IO栈进行了一些重构,以便更好利用闪存特性,更好的实现系统级的盘控协同。

为此,浪潮充分发挥控制器的极值,并在软件方面进行大量优化,体现在丰富原子写、启动盘、多Namespace、SMART、带内带外管理、NVMe-MI、温控、异常掉电保护、固件鉴权加密等基本功能,以及各种各样跟传统HDD市场实现兼容的新功能,甚至与全闪系统进行适当整合。

在业务融合方面,浪潮从去年开始陆续推出更多新的技术,除了新架构的变化,还有新介质,这些都是为了适配上层应用。

针对SSD的失效模式,浪潮在对全闪进行了相应应对,比如故障预防、数据保护、温度检测、风扇转速调整、寿命预测、故障巡检等一系列措施,避免同时出现坏块,导致数据无法恢复的情况。

这些措施可以使SSD的故障率在全闪系统里下降60%,实现自动化寿命管理。

标准SSD功能支持非中断业务升级,系统不重启或不中断业务下,3秒中之内完成对设备固件的升级,整个过程中对于业务完全不感知。

为了实现这个目标,浪潮SSD保证在升级的时候PCle链路不中断,让SSD依然响应基本PCle操作,同时还要求任何NVMe命令不能超时30秒。

未来SSD三新:新架构、新协议和新介质

王杰华认为,新架构、新协议和新的介质,驱动整个存储行业架构的软、硬件交替更新,并且推动了全闪存行业的发展。

新架构

从前两年FMS(全球闪存峰会)上火热的Open Channel到刚刚过去的FMS大会上提到的Zone Namespace,呈现出这样一个明显的趋势,即规范越来越标准化,跟业务结合更紧密,跟生态环境更友好。

在Open Channel架构下,SSD只做包括错误处理,磨损均衡,介质管理在内的一些基本命令解析。在HOST会运行比较复杂的FTL,做数据排布、垃圾回收,在HOST和SSD之间用PU 并行单元进行交互,中间交互及底层驱动都是非标准的。

ZNS同样继承Open Channel的理念,但标准化层面做的更好。SSD侧也只运行简单的FTL,负责基本的错误处理,磨损均衡和介质管理,在HOST侧有较为复杂的FTL,完成数据排布、垃圾回收这样的工作。此外,主机侧包含了ZBD驱动,构成一个完整的软件架构。

对比Open Channel和ZNS,从技术角度,后者因为Mapping table以Zone为单位,占用内存更少一些。在主机侧可以复用现有的SMR硬盘软件驱动架构,标准化程度更高。

从应用角度,因为是一个非标设备,Open Channel实际应用中现有的业务和运维面临的挑战都比较大,对其推广使用造成阻力。

从生态环境,目前主要的HDD与SDD厂商并没有清晰的Open Channel规划,相反都有类似SMR的硬盘。ZNS的很多软件架构已经进入到Linux主线版本,具有更好的开发者生态环境,因此更有前途,明年中有可能纳入到NVMe的规范中。

新协议

Multi-Namespace在NVMe1.1协议中已经具备,最初用于逻辑资源的划分以解决SSD盘容量过大的问题。

随着协议的演进,NVMe1.3中出现了Multi-Stream这样的概念,本质上是用户端将很多带有业务标识的数据IO发送给SSD并跟Namespace绑定。这时一些业务已经开始和Namespace与SSD有比较强的关系。

NVMe1.4中,NVMe Set/IOD在与业务结合方面更加极致,从业务到逻辑层,再到实际物理层进行完整切分,解决了互相干扰的问题,同时保证QS指标。

新介质

TLC、DRAM、SCM、MRAM、PCM这样的介质各具特点。如何利用这些介质?同样要跟上层业务数据进行强关联。

例如,TLC比较适合存放温数据和通用持久数据,SCM更适合热数据,浪潮更看好MRAM,原因在于MRAM在性能方面最接近DRAM,有机会取而代之。此外,MRAM也可以在盘上做数据的写缓存,既可以实现大容量,同时又能保证掉电不丢失。

新介质支持更多Multi-Stream数,目前Multi-Stream支持个数通常为8-16,但一些超大规模数据中心客户对Multi-Stream要求甚至希望上百,而这是当前Write Buffer方案无法满足的。MRAM就是最好的选择。

总结

王杰华总结说,SSD从早期的性能优先,包括低功耗、低延时、长寿命特性到偏重各种各样的功能,再围绕着业务价值逐步提升,Multi-stream、NVMe Set、ZNS、异构介质存储等概念层出不穷,体现出三个不同阶段发展趋势和变化。

浪潮的新存储之道 “云存智用 运筹新数据” 与SSD密切相关,浪潮的分布式存储平台与统一存储平台为SSD进行了IO栈重构,实现了SSD健康管理和AIOps。

未来SSD市场,还将会有更多的新技术、新产品和新方案问世。