数据中心SSD存储发展的几大趋势:除了PCIe Gen5和AI,还有这些……

作者:黄烨锋

无容置疑2020是非常特别的一年,疫情的初期由于防护和隔离的要求,在某种程度上影响了SSD的产能和销售,然而当今高度互联的世界很快就调整了过来,充分利用网络来进行正常的商业生产和生活,使得宽带,网络会议,社交服务网站等有了急速的发展,因此也带动了对高性能SSD的需求。

随着超过100层的3D NAND的量产,QLC逐步被PC OEM厂商采用,NVMe标准提出了更多新的功能,SSD存储控制也在不断发展。为此,我们专访了英韧科技(上海)有限公司联合创始人、SoC设计副总裁赖的是先生。英韧科技是专注于SSD主控芯片的一家国内企业——这家公司在短时间内就声名鹊起。除了产品之外,很大程度也是源自其最初的几名创始人,包括吴子宁博士、赖的是等此前都有Marvell这类老牌企业的工作经验,比如吴子宁博士此前是Marvell的全球CTO,而赖的是则是东芝美国高级研发总监。

在与赖的是的对话中,我们大致可以窥见企业级尤其是数据中心SSD市场发展的几个重要趋势,并且从中理解英韧科技预备为行业带来的一些新的技术;同时也加深对于某些特定技术和应用发展方向的理解。

威刚去年展示的达到7GB/s顺序读取速度的PCIe Gen4 SSD,采用Innogrit Rainier控制器

PCIe Gen5提前到来

赖的是在与我们对话中,首先就提到了PCIe Gen5 SSD的即将到来。这就让人感到意外,因为目前PCIe Gen4还正在普及之中,PCIe Gen5为什么就要来了?“Gen5比想象中来得要快一些。Intel打算明年正式实现Gen5的支持。整个高端存储产业,明年年初到年中,就会有一些Gen5的产品问世。大概到2023年,Gen5的产品可能会更多。”赖的是表示。

英韧科技现有面向数据中心的Tacoma产品线,“我们准备把Tacoma升级到PCIe Gen5”。同时赖的是确认了,英韧科技明年就会有PCIe Gen5的SSD控制器产品推向市场。

“事实上,每代PCIe规格产品的迭代大概是5-8年。Gen4的迭代可能会快一些,我们可能会以更快的速度跨入Gen5产品的支持。Gen6则还需要一段时间,要求也会很高。”

Gen4的迭代为什么会更快?赖的是补充说:“AMD在2019年7月7日发布了PCIe Gen4的chipset支持。Intel在2020的下半年才有一些对应的产品问世。Intel期望能够挽回技术领导者位置,立刻就准备去支持PCIe Gen5。”

事实上在Intel晚于AMD近一年才推出PCIe Gen4之际,市场就猜测Intel可能会更早地跳过Gen4过渡到Gen5。在Intel的规划表中,今年将推向市场的服务器平台Sapphire Rapids(Willow Cove)会首次引入DDR5和PCIe Gen5支持,而且支持的通道数上限还将更高。

与此同时,明年推向市场的Intel首个大小核设计的Alder Lake,以及AMD Zen 4都将实现对PCIe Gen5的支持。另外,2019年Intel就宣布其CXL(Compute eXpress Link)缓存一致互联就将建基于PCIe Gen5。

在我们看来,这是x86阵营两名市场玩家竞争,带动周边I/O大跨步的体现。英韧科技作为PCIe Gen4 SSD控制芯片的领导者,也将抓住PCIe Gen5的科技创新和领先的机会。“今后英韧的产品会逐步变得普及,各种应用场景都会适配。”赖的是说,“我们会走向高端市场,比如说16个通道,再加上PCIe Gen5市场,去开辟我们的新增长点。”

“PCIe Gen5带宽实际上就是PCIe Gen4的两倍,每个通道从 16 Gb/s变为32 Gb/s,X8就是256Gb/s。目前已经有了100Gbps、200Gbps的Ethernet Backbone, 用PCIe Gen5 X8去连接服务器所能实现的吞吐量就大了很多。”

虽然就目前来看, PCIe Gen5 “真正走进消费用户或数据中心,应该还需要一段时间。PCIe Gen4目前刚刚进入到数据中心领域。服务器更新一般是4-5年为一个周期,产品后续淘汰20%-25%。而且PCIe Gen5的产品也比较贵。” 想必最早的PCIe Gen5产品会集中在企业级应用上——正如Gen4最早应用于数据中心,如今开始普及到了消费市场。但由于当前市场的特殊性,PCIe Gen5大约的确会提前来到。先一步有PCIe Gen5的产品落地将是英韧科技这类技术领先的高端应用企业间的新一轮的较量,也很有可能成为新的市场格局建立的起点。

存储中的AI技术

英韧科技联合创始人、董事会董事长兼CEO吴子宁博士在FMS 2019(闪存峰会)上曾经做过题为《怎样通过系统与控制器优化,实现2倍吞吐和IOPS(How to get 2x throughput and IOPS by System and Controller Optimization)》的演讲。英韧科技也是较早提出“智能存储”,或者“AI存储”的企业之一。

这项技术预期是应用在英韧科技的Tacoma控制器中的,意即主要面向数据中心。

赖的是在采访中向我们解释了AI在SSD存储中的价值。“有个冷热数据的概念,我们已经验证了在SSD存储过程中对冷热数据进行区分的实现方法。什么是冷热数据呢?如果某段空间频繁读写,那么这就成为了热数据;一段空间很长时间采取读写一次,那么就是冷数据。”

“我们知道,SSD的PE cycle(Program/Erase Cycle)是有限的。如果频繁读写某一段空间而不做特殊处理,就会影响整体SSD的寿命。如果能够将冷、热数据分开,热的数据比如说放到SLC或者其他PE cycle更久的NAND区间,整个SSD的寿命就会增加不少。这是个使用趋势。”

“对于数据中心这类应用而言,我相信这样的技术能够带来性能上的提升。”虽然赖的是很谦虚地表示目前仍在“尝试以后会不会变成流行,能不能给客户带来利益”,并表示“希望它会成为趋势”,但我们认为其发展潜力仍然是相当之甚的,足以成为企业级或至少数据中心类SSD发展的技术趋势。

吴子宁博士在闪存峰会上的主题演讲提到,“英韧科技找到一种方法,基于这些SCM构建低时延SSD。结合网络(NVMeOF)、软件(新型的文件系统)上的改进,我们能够将整体访问时延缩减85%(从远程服务器获取数据)。”吴子宁博士说。

其中针对时延占比较高的SSD,下面这张图是当时吴子宁博士提到降低SSD时延,各部分的方法。比如SCM介质替代TLC NAND;英韧科技开发的新型ECC架构将控制器的时延降低至5ms;再加上PCIe Gen4将传输时间减半。”

这个数据应该是基于XL-FLASH(铠侠、西数推的一种SCM),相比一般的TLC NAND实现了据说将近10倍的读取时延缩减,亦极大增加了IOPS(IO per second)。

虽然SCM很快,但同时成本高、容量小。“要造大而快的存储,最符合直觉的方法应该是把TLC和SCM结合起来。”“关键是把热数据(hot data)放进SCM中,能够实现快速存储;而将冷数据(cold data)放进TLC中,以降低成本。”

不过怎么才能知道数据是“冷”的还是“热”的呢?这其实就是“智能存储”这个称谓的由来。英韧科技就应用了AI,或者说神经网络。首先是做数据识别的模型训练,喂的数据是PC用户数据时,据说能够实现99.94%的精度;针对企业数据应用另外的模型,则可实现94.72%的精度。基于此在控制器中加入冷/热数据的预测器。

在控制器芯片中,这个预测器应该是个专门的硬件单元。输入是用户数据,输出则是冷热数据标签(flag)。存储管理模块利用这些数据标签,将对应的热数据放到SCM中,将冷数据放进TLC NAND。当然这种设定在英韧现有架构的实施方案中,可能具备了更大的弹性。

这个架构被英韧科技称作Tacoma架构,即利用CPU和专门的神经网络加速器进行冷热数据的预测。应该也是英韧科技Tacoma系列产品名的由来。结合XL-Flash,AI技术,各种读写、检索操作相比没有应用这些技术的普通SSD(虽然keynote上并没有明确对比对象),吞吐增加将近2倍。而且它相比由应用去说明冷/热数据,具备了比较出色的自适应性。

我们特别询问赖的是,应用于Tacoma的AI专用硬件IP,是否来自英韧科技自己。“也不是一开始就是自己的。存储中应用AI,我们自己也一直在摸索的过程中。刚开始我们用的是NVDLA(Nvidia Deep Learning Accelerator)。”赖的是说,“后来逐步发现我们的方向,包括听取了客户的需求,跟之前有一些不符,所以我们就开始自己做。”

RISC-V成为选择之一

去年11月份,SiFive发布的博客文章中提到SiFive和英韧科技合作,英韧科技未来的SSD控制器可能会采用SiFive 7-Series核心IP。赖的是表示,“我们一直与ARM紧密合作,目前所有的SSD控制器都使用ARM的CPU。由于RISC-V 逐步成熟,加上我们有不少客户在要求我们对RISC-V的支持,我们开始考虑把RISC-V作为选择之一,从而开始和SiFive以及国内的StarFive(赛昉科技)进行了技术讨论,探讨未来可能的合作。”

“我们对SiFive和StarFive的RISC-V CPU做过一些测试,我们觉得其潜力不错。其性能和ARM R5系列类似,设计比较灵活,同时也有某些对SSD控制比较友好的功能。”赖的是说。

SiFive也的确在宣传页上,提及SiFive面向存储市场的的7 series。虽然我们不清楚英韧预备在未来推的产品具体会采用哪个IP,不过SiFive方面曾提及ISC(In-Storage Computing) SoC所需的一些关键特性。这些特性,实则也能帮我们更深入地理解,SSD主控芯片中的处理器,究竟有什么独特。

这些特性包括:(1)低时延、实时地执行数据移动,以及智能的损耗均衡管理,实现SSD寿命延长、增强SSD存储设备的可靠性。(2)跑Linux应用,实现各种数据处理、数据分析、AI计算,在存储设备内执行;也包括追踪、debug、高级中断控制、安全、硬件加密等。(3)“在全球范围内,降低商业风险,加强产品可用性”。

以上几点看起来是相当契合英韧科技SSD控制器产品需求的,当然还有Silicon Proven实现层面的问题等等。其中技术选择多元化、“降低商业风险” 大约也是英韧科技作为一家中国企业,开始选择RISC-V的原因。

西数一直以来就是RISC-V的支持者,2017年就宣布准备将HDD、SSD和存储系统的处理器转向RISC-V,其SweRV核心就是RISC-V架构;此前希捷面向HDD也宣布利用RISC-V控制器做HDD磁头定位的运动控制信息处理;韩国FADU很早之前就有RISC-V SSD解决方案……或许现有市场环境,对RISC-V而言,是个相当难得的契机。

未来的更多机遇

英韧科技作为成立仅4年的初创企业,已经实现了3颗芯片的流片和量产,产品落地效率还是相当之快的。所以此前CES展一些成熟的SSD产品上都能见到其身影。在我们看来,这类有丰富行业经验的技术领军人物带领的年轻企业,眼中的机遇大概是更能代表存储行业未来的。除了上述几个相关SSD的几个重要趋势外,赖的是在谈英韧科技着眼的方向时,主要提到了两点。

“一方面是PCIe,刚才已经提到过了,我们可能会更快地跨入到Gen5产品的支持。”赖的是说。

“而在闪存方面,接口速率也在不断提升。从800 MT/s,到1.2 GT/s、1.6 GT/s甚至更高。这也是我们要投入和保持领先的一个方向。”

“控制器本身要根据这两边的情况往前走,我们一直在做相关的开发和跟进。随着对于这些方向的理解,AI存储就是为了解决怎样更高效地使用存储的问题,存储就成为了一个存储系统。”

“我们在这方面都有规划,包括数据处理的加速,还有存储系统本身。比如最新的一些存储系统,像是ZNS(Zoned Namespaces)、Key-Value Object storage的支持等等,都会是我们关注和投入的方面。”这些机遇,理论上应当也是其他SSD控制器市场玩家的机遇。

英韧科技目前面向市场的策略似乎是首先由Shasta、Shasta+以及Rainier,打开消费级、企业级及工业级市场,扩大产量和用户群。“我们还会有一些迭代,把性能做得更好、功耗做得更低,同时降低成本,让客户能够从中受益。那么今后的产品会更为普及。各种应用场景都会有。包括逐步在数据中心这样的市场上一展拳脚。“

面向高端客户端、数据中心和企业级应用的Rainier和Tacoma系列控制器都选择了台积电的12nm工艺。“之前的PCIe Gen3,选择的节点是28nm,PCIe Gen4我们用的节点是12nm。简单地说,这个节点的优势在die size上,12nm大概是28nm的一半。”

“而在功耗方面,12nm大概是28nm的40%左右。假设要是用28nm去实现PCIe Gen4的话,功耗会比较大。” 这应该是为英韧科技做企业市场开拓的组成部分。尤其像Tacoma这样融合了各种尖端技术的SSD控制器,会是我们更加乐见的。