大约在六年前,业内开始出现30TB的企业级SSD。去年,Solidigm发布了61.44TB的企业级SSD,刷新了行业对容量的认知。而如今,Solidigm再次突破极限,推出了122.88TB的企业级SSD,将业内最大SSD容量提升到了全新的高度,也为数据中心带来了很多新变化。
AI推动闪存存储技术快速发展
这让我们见识到,SSD技术正在快速发展当中。前不久,有外媒进入了xAI这个拥有10万块英伟达H100的数据中心。我们注意到,这座数据中心的存储设备已经全部使用了NVMe固态硬盘,闪存已经成了AI数据中心的默认配置。
最近,Solidigm亚太区销售副总裁倪锦峰在采访中提到,从今年4月开始,市场对大容量SSD的需求开始崛起,直到现在,大容量SSD在市场上非常受欢迎。这让Solidigm看到了很多希望和挑战。
倪锦峰认为,AI加快了存储技术的创新步伐。一方面,用户需要SSD的性能将数据更及时地给到GPU,减少GPU浪费。另一方面,AI数据中心需要SSD来优化电力和空间占用。最后,为了应对更大的数据规模,迫切需要更大容量的SSD。
具体到AI场景中,在数据准备、模型训练和推理等阶段,最好使用带有Gen 5.0接口的Solidigm D7-PS1010,或者Solidigm D7-P5520这样的TLC盘,或者Solidigm D5-P5430这样,具有较高性能的QLC盘。
而在数据摄取与存储阶段,可以使用像Solidigm D5-P5336这样主打大容量的QLC固态盘。Solidigm D5-P5336去年率先把容量做到了61.44TB,据了解,截止到目前,Solidigm QLC SSD出货量已经超过100EB,足见用户对于大容量盘的认可。
现在,Solidigm又把容量做到了122.88TB,并采用了PCIe 4.0的接口,作为一款支持16K IU的SSD,Solidigm D5-P5336能够在更低成本和更少资源占用的情况下管理超大容量。同时,针对数据密集型工作负载优化的性能,可更好地满足多种存储需求。
122TB的Solidigm D5-P5336来了,它带来了什么变化
61.44TB的企业级SSD容量翻倍,带来了什么呢?与传统基于HDD的JBOD和基于TLC SSD的JBOF相比,全部采用122TB的Solidigm D5-P5336企业级SSD的话,在空间占用上减少了4到8倍,可大幅减少机房空间占用。
如果以硬盘本身占用的空间来计算,同样要提供122TB的存储容量,如果用30TB的HDD,则需要4块,算上长宽高的物理空间,实际会占用的空间是一块Solidigm D5-P5336的15倍。
122TB Solidigm D5-P5336虽然容量翻倍,但功耗数值并没有什么变化,也就意味着每TB的能耗又一次大幅下降。在方案总体容量不变的情况下,它的总功耗和散热需求,与此前相比还会相应降低。
如此一来,122TB Solidigm D5-P5336就能为GPU腾出更多能源。如上图所示,如果采用TLC加HDD的方案,存储部分将占用20%的能耗,如果是纯TLC方案就是8%,如果是纯QLC方案就只有3%左右,节省出来的电可以支持更多GPU的部署。
倪锦峰提到,越来越多的用户对全QLC方案的接受度提高,而如果现在用QLC替代现在常见的TLC加HDD的方案,在存储机架空间、电力成本和维护成本方面都会带来非常多的节省。
倪锦峰表示,用大容量QLC来替换HDD是一片新的蓝海市场。相比几年前用16TB或者32TB的QLC来替换TLC,现在如果用QLC来替换HDD,受益规模会大很多。
有数据显示,全球范围内,目前SSD在数据存储领域的占比大概只有10%+。如果通过创新的QLC技术来解决存储在可靠性、性能、空间利用、能耗方面的问题,替换掉其中一部分的HDD,那么SSD的规模就可以迅速提升上去。
把61TB的SSD翻倍成122TB,说容易也不容易
Solidigm能成为第一家把容量做到122TB的企业级SSD厂商,也并不意外。这不仅用到了Solidigm掌握的Floating Gate浮栅技术,还利用了Solidigm D5-5336系列已被广泛验证的技术,对于Solidigm来说,把容量翻番其实相对容易很多。
但实际上,122TB的SSD需要将整片晶圆的800多个die封装到一个SSD中,这不仅成本极高,对质量要求也极高,任何微小的组件缺陷都可能报废整块盘,难度其实很高。Solidigm通过更严格的原材料和生产管控,确保大容量SSD的高质量和高可靠性。
自2018年以来,Solidigm一直在推动QLC技术的发展。尽管从实际使用来说,QLC SSD本身的写入寿命已不成问题,因为很多用户实际写入数据的频次比想象中低很多,但还是有担心的声音不绝于耳。
这次,Solidigm表示,在大多数工作负载场景中,122TB SSD可满足五年内随意写入的耐用性要求,打消了用户对于寿命的顾虑。而且,这不是因为PCIe 4.0的限制,即使是换成PCIe 5.0也一样不用担心寿命问题。
如今QLC的接受度已经大大提高。有数据显示,到2024年,Solidigm QLC SSD的累计出货量已突破100EB。从Solidigm方面的数据来看,财富500强的前五名,还有70%以上的OEM AI存储厂商,都在大规模使用Solidigm QLC SSD产品。
这些数据不仅足以证明QLC值得信赖,也能说明Solidigm的QLC产品本身足够可靠,能够放心用在满足绝大部分AI的工作负载需求。特别在AIGC领域,Solidigm的QLC产品得到了不同地区算力服务提供商的广泛采纳,容量从32TB、61TB都有。
目前看来,大容量盘已成为很多AI数据中心的主要选择,随着Solidigm的122TB SSD的发布以及后续大面积铺货,大容量固态盘将在AI数据中心领域进一步发挥重要作用,也将改变整个闪存技术业态,属于QLC的时代终于来了。