11月9日,由百易传媒(DOIT)主办,以“数据觉醒新时代”为主题的2022中国数据与存储峰会在北京开幕。
峰会邀请了高端存储知识CHO西瓜哥发表“从美国闪存峰会看中国全闪机会”主题演讲。演讲分三部分,一、从用户角度,谈参加今年8月份的美国闪存峰会心得;二、存储架构创新企业分享;三是闪存对信创存储的思考。
闪存峰会参会心得篇
美国闪存峰会一些热点分享:
一、CXL。内存互联的标准技术,今年闪存峰会最热的一个词就是CXL。所有的厂家都在谈,而且有专门的分论坛,很多厂商推出了相应的产品。
三星在会场上推出内存语义(Memory-semantic)SSD,可以直接有CXL的接口,做闪存或内存用。这个会议上厂商都在谈全面转向CXL的话题。但我问了很多分析师,也和很多业内人士做了交流,大家都认为CXL还处于早期阶段,真正在企业里普遍使用估计要等3到5年。
因为CXL要真正发挥其优势,可能需要PCle 5.0,看现在的存储里都是PCle 4.0,PCle 5.0很少,包括存储节点,支持PCle 5.0的也很少,而且这个标准出来也不是特别久,虽然很热,但我觉得离大家真正用上还有一段时间。
第二个热点是英特尔傲腾的问题。正好开会前一两天英特尔宣布不再继续投入傲腾技术。当然现在还可以买到傲腾,市场上也有库存,但以后不会再有新一代傲腾技术。这对整个SCM产业有很大的影响,因为傲腾发售量占比最大,相当于其它所有的存储级内存的总和。如果它不做了,市场走向会如何?
这也是一些初创企业从傲腾转向CXL,CXL变得很热门的原因之一。这个转向还有点早,因为整个CXL生态还没有到来。转向没问题,但真正交付时会发现傲腾生态发展已经快十年,是很成熟的技术,生产交付已成体系,而CXL很新,交付一些项目时会比较麻烦。
作为存储用户,尤其企业存储而言,我们特别需要SCM这层,因为普通的SSD在性能上相差还是太远,傲腾SCM很好地补全了这个空隙。新的SCM如何选品,基本包括三个可选项,三星的Z-SSD,但是PCIe插卡的形态,我们喜欢盘的形态。这次峰会上三星也没有展出这样的产品,我觉得它不是特别主推,可能未来会转向CXL。
东芝有现成的盘形态存储级内存,用的是XL–FLASH,虽然相比傲腾有差距,但比普通闪存快很多。东芝在展会上也推出了很多软件补丁做加速。另外在展台上大普威基于自己的主控+XL–FLASH颗粒也推出了存储级内存。
第三个热点是PCle 5.0/EDSFF。E3.S未来可能取代U.2。因为CXL很火,但CXL真正发挥其性能需要到PCle 5.0。并且PCle 5.0的形态也在发生变化,现在用的PCle 4.0最通用接口是U.2,但PCle 5.0会有新的接口——EDSFF,这种新的接口非常流行,而且有很多中规格。
个人觉得E3.S规格跟U.2的规格很接近,长度宽度比较接近,对服务器的设计改动会比较少,从存储的角度考虑,E3.S可能会平滑地替代U.2的SSD接口。其他接口可能会在大型数据中心使用,一般的企业级数据中心不是很通用的产品。
第四,QLC/PLC,企业市场预计明年加速。闪存和硬盘成本预计5年内还是会有3-5倍的差距。闪存比硬盘便宜不太可能,但可以更便宜,推出QLC理论上可以做得更便宜。
但基于QLC的消费级盘很多,企业级盘少,目前市场上能买到的有一家——Solidigm。这家企业在会场上也发布了PLC的盘,这也是未来的趋势。
三星推出了PB级SSD,说支持QLC,但展品写的是TLC,可能QLC是在路标里。现在市场上QLC企业级盘很难选,首先国内支持QLC的只有XSKY这一家,因为在存储上要做很多优化。国外有很多,如VAST DATA。由于市场上企业级的QLC盘选择不多,它的价格没有下来,成本没优势,市场发售量就起不来,现在最大的问题是市场上可供货的,支持QLC企业盘的产品太少。
第四是SmartNIC/DPU/计算型存储。SmartNIC/DPU/计算型存储在会议上争议很大。计算型存储有很多形式——盘式和卡式,卡式是一个存储节点+一块计算卡,盘式是在SSD上集成ARM CPU,每块盘都有计算能力。但目前市场并不大,竞争力减弱,未来计算型存储也会有一些标准,我个人没有看得特别清楚这个市场。
首先我更倾向于用一个存储节点+一块计算卡,成本更低一些,如果每个盘上都有一个CPU成本太高,而且很难找到很多场景把每个SSD盘上的计算功能都用上,这是我比较困惑的地方,但未来标准化以后可能会是大市场。
第五是铠侠正在推出的软件定义闪存概念,还有以太网接口的SSD。个人持保留态度,成功可能性不大。因为十几年前以太口在硬盘上做过一次,基本上就是很小众的市场。而闪存变成以太口也可能是同样的命运,可能以后也会标准化,有标准会好一点。
软件定义闪存的架构创新
高端存储变得闪存化,但其架构没有太大变化,我从软件定义方面谈一谈企业对全闪的架构创新。第一个厂商是VAST DATA,还没有进中国,它的产品架构做得比较好,就是用SCM做缓存,下面用QLC做真正的数据落盘,把成本降得很低。
VAST DATA支持很长的纠删码,支持200+4,相当于得盘率很高。还有重删压缩技术,通过整体架构的改良,把成本降下来,号称第一家能做到综合成本比硬盘便宜的厂商。不过产品只适合大客户,小用户买它不行,比如纠删码很长的优势,200+4,最少200多个盘,小项目只买三个节点,产品性价比肯定上不去,这是做闪存的创新。
第二是闪存文件方面的创新公司——Weka,其最大的特点是NVMe优化做得很好,而且把对象存储纳入进来作为一个整体,数据在上面流动,把综合成本降下来。它不通过QLC降成本,是通过接对象存储在后端进行分层,对用户透明,来把整体成本降下来。
第三是做块存储的厂商——以色列公司Lightsbit,采用NVMe-OF分离的架构来做的,支持的协议是(NVMe/TCP),NVMe/TCP本来很小众,本来只它一家,现在已经成为一个国际标准,主流厂商现在都支持,比如VMware、EMC。所以NVMe/TCP已经成为一个主流技术。
第四个我认为是未来闪存变革的方向——VMware在不久推出的vSAN8新品,把原来的全闪架构全变了,之前是一层缓存一层SSD,就算把硬盘换成SSD,缓存层也必须有,时延上做得不是特别好,就很难支持高性能应用。
推出vSAN8以后,它变成了单层架构,缓存层没了,数据从计算节点下来直接落到NVMe盘上,NVMe点对点通信很快,也不占CPU资源,时延会降到最低,充分发挥NVMe闪存的优势。
我认为这是未来的方向,目前还没有看到太多产品往这方面走,因为很多的传统闪存都是两层架构,vSAN做出了一个榜样,现在已知国内一些厂家已经在做这方面的产品,可能明年会看到国内厂商推出单层架构存储产品。
闪存对信创存储的思考
从技术层面来看,我的观点是如果信创存储用软件定义存储的方式做是比较好的思路。原因有两点,因为我给金融信创实验室做培训,他们金融信创实验室有信创的服务器,也做了很多的测试和应用,生态很完善,鲲鹏、麒麟、统信,服务器的生态目前是整个IT生态里最成熟的一块,如果存储的话,软件定义的话,基于服务器上面再跑软件变成存储,自然而然就成为信创存储,用起来更简单一些。
这次可以利用底层成熟的硬件生态,构建信创存储的关键。而且信创存储也是目前很好的方向,目前在高德纳技术曲线中也是唯一的变革性技术。
第二个特点是软件定义存储可以兼容现在的服务器。信创的CPU供货总是有一点不确定性,毕竟会受到国外的一些影响,如果用软件定义存储的方式,扩容选品会自由一些。分布式架构还有一个好处,个人感觉目前所有的信创服务器相比X86服务器的性能和稳定性上略有差距,这不得不承认,但其整个存储架构是稳定的,也会屏蔽掉一些信创底层硬件不太稳定的问题。
从周边产品来看,介质方面,信创存储介质怎么选,硬盘没法选,目前所有的硬盘厂商只有三家,西数、希捷,还有东芝,国产厂家没有做硬盘的,而且大家公认硬盘市场不是未来的方向。如果要做信创存储的话,让存储程度更彻底,硬盘就不能用了,只能用闪存。
闪存刚才讲还是太贵了,比硬盘贵3-5倍,希望它能适配最新的便宜的介质,比如刚才说的QLC/PLC,听说大普威明年也会推出新的国产QLC企业级SSD,国产的QLC盘有了,可能会把成本降下来。
冷存储怎么办?没有硬盘,可以直接跳过用蓝光,如果大的,需要长期存储的数据可以存在蓝光上,国产厂商也可以选择。走全闪加蓝光方向构造一个全信创的存储。
存储网络方面,现在看到以后存储的网络肯定是NVMe -OF,但下面的底层技术还是传统技术,以太网或者infiniband、FC,很多厂商都会习惯用FC或者infiniband,但这两者国内都没有投入,以太网方面,在信创市场,华为、新华三等很多厂商都是以太网支撑的,而以太支撑NVMe就要两个技术,一个是NVMe/TCP,第二个是RoCE,前者优先考虑,因为对交换机没有要求。如果你要RoCE,虽然性能比较好,但要用数据中心交换机,目前来看成本有点高。
总结
1、如果信创存储选型,可以优先考虑SDS形态,但有些场景SDS不适合,比如金融客户,后台系统可能不需要很大的扩展性,但需要高稳定性,个人不建议用软件定义存储,还是用传统的存储,比如华为、宏杉都有信创的高端全闪存储。
2、SDS的全闪,我个人认为未来单层架构是未来创新方向。
3、信创产品的介质肯定要优先考虑闪存,因为硬盘没有信创的产品,所以需要这些厂商加大对QLC/PLC的适配。
4、存储的网络优先选择以太网。
5、信创不是一个封闭的环境,要安全跟封闭不是等同的关系,大家应该有一个开放的心态。未来信创在全球可能IT是两极市场,一个是以美国为首的西方国家,有些是以中国为首的东方国家,信创以后也要追求商业化的成功,不可能只有国内用,肯定也要走出去,生态上要和全球的IT融合。
(该速记整理未经本人审阅)