把玩Solidigm企业级固态盘D7 P5520,但我完全不会测怎么办?

体验过好些消费级固态盘,而现在,我也终于有机会把玩到企业级固态盘了!

想要玩企业级固态盘,首先,需要一台服务器就行,但是,我没有!这就得放弃了吗?

那不行,好容易借到一块企业级的固态盘,必须得进行一番地狱式的操练,作为它进入数据中心之前的一次难忘的回忆。

请记住这张图片,今天折磨的对象就是Solidigm的D7-P5520。

至于为什么依然用的是英特尔Logo,原因很简单,英特尔NAND相关业务出售给SK海力士,而后成立了新的存储公司——Solidigm。

内心OS:贴有英特尔Logo的Solidigm固态盘,属于卖一块少一块。

D7-P5520的个人和家庭背景

D7-P5520和D7-P5620是Solidigm成立后首次推出的企业级产品,命名规则延续了此前英特尔的风格。(不只是命名规则,方方面面也都是原汁原味的英特尔品质)

D7-P5520的上一代是D7-P5510,这两个都是PCIe 4.0,而再上一代则是PCIe 3.0的D7-P4510。D7-P5620的上一代是D7-P4610,同样也是PCIe 3.0。

PCIe 3.0的盘采用的都是64层TLC,而新的D7-P5620和D7-P5520则采用的是144层TLC。其中,D7-P5620只有U.2这一种外形规格,而D7-P5520则更灵活,有U.2、E1.L和E1.S三种外形规格。

应用场景方面,由于D7-P5520的DWPD为1,所以更侧重读优势,而D7-P5620的DWPD则可以达到3,性能更高,也更侧重读写混合的场景。

我手里拿到的是D7-P5520的U.2版本,官方给出的数据显示,其相比前两代的PCIe 3.0版本有比较大的提升,相较于上一代的D7-P5510也有不少提升。

D7-P5520的4K随机读取性能提升最高可达42%,4K随机写入性能提升高达17%,延迟降低多达43%。

对照官网上给出的基本性能数据,我制作了上图,如果万一数据有错,以官网数据为准,至于具体数据如何,那,不妨简单试试!

开始尝试把玩企业级固态盘:Solidigm D7-P5520

很少有企业级固态硬盘会被放在消费机的电脑上,手里的这块P5520就是一块!

测试环境:一台饱经风霜、风烛残年的台式机

CPU:Intel i7-6700K

主板:Z170

内存:4 X 8G 3200

接口:PCIe 3.0

OS:Ubuntu 20.04/Kernel 5.13.0-44-generic

在没有经过任何优化的“老旧破”平台上,我装上了Ubuntu系统,装上了这块价格相当于一台M2的Macbook Air的企业级固态盘,这种怪异的“奇葩”组合称得上是空前绝后了。

正在我拿着转接板,迫不及待看这款插在PCIe 3.0插槽上的PCIe 4.0固态盘时,却意外发现,系统根本发现不了它。

插曲1:系统不识别U.2 PCIe 4.0的P5520

毕竟英特尔酷睿i7 6700k都已经是2016年的老机器了,那时候还没有PCIe 4.0,虽然能向下兼容,但可能机器本身还有其他使用问题,于是我插在了另外一台电脑上。

配置:一台积热严重的AMD主机

CPU:AMD Ryzen7 5800X

主板:B550M

内存:4X8G 3200

接口:PCIe 4.0

OS:Windows 11

结果,这台电脑也不能识别这块盘。于是,我一口咬定这是转接板的锅。

毕竟U.2的盘不能直接插在PCIe x16的插槽,我还用了一个看起来比较简陋的转接板,因为过于简陋,所以,我一度以为是转接板的问题。

于是,我又买了一块新的转接板,等了几天的快递,当我插上新的转接板,两台电脑还是都不能识别固态盘。

然后,我意识到,这是一块坏盘!

正当我打算吐槽Solidigm的时候,对方工程师小哥哥自信满满的说:“我们虽然是新品牌,可是源自英特尔的技术和工程积累,怎么可能随便坏,你试试更新下BIOS?”

我:“PCIe 4.0固态盘也就这两年的事儿,我这16年买的老机器更新BIOS有何用?”

看在他是前英特尔现任Solidigm工程师的份上,我耐心找到了新BIOS刷了上去,没想到,这块盘居然能被识别出来了!

从把它插到电脑,到我真正看见它,前后经过了大约十天时间,当我还没有正式蹂躏它的时候,它已经开始教我做人了。

看都看见了,不进行一番加倍的折磨,怎么对得起我过去的十天时间!于是,我安装了Fio进行存储压力测试,这时,我又发现一个严重的问题。

我不会在Linux环境下测硬盘,而且还是企业级硬盘。

插曲2:Linux下怎么测?预处理有多重要?

我平常用的都是HD Tune,Cysystal,AS SSD,IOmeter之类的Windows测试工具,Linux都只是略知一二,那怎么测呢?

在这儿不得不承认的是,Solidigm文档水平堪称超一流!在我看到这个文档后,绝大部分问题都迎刃而解了。

文档先是从AHCI和NVMe对比说起,将乱七八糟的技术知识点用平实易懂的语言娓娓道来,一时看得我还很激动。

文档里还提到了很多优化延迟等表现的高级操作,出于本人水平和实验环境的限制,这里暂且按下不表。但可以具体聊聊此前文中提到的两个Fio测试脚本,这次我只小改这俩脚本做本次测试。

正式测试之前,需要做预处理(pre-conditioning),为什么要做预处理呢?

做完预处理后再进行跑分,有助于展示SSD在真实业务场景中的表现,包括吞吐、稳定性、可靠性以及QoS,各方面的表现都会比较稳定。

通常,新盘的空闲空间大,垃圾回收操作少,所以性能都很高,用过一段时间后则会有所变化,这才更接近绝大部分正常使用时候的表现,这个预处理能让硬盘提前进入这个状态。

就好比电影《非诚勿扰》里,葛优对舒淇说,直接老夫老妻的状态,能接受这个,两个人就肯定能长久,毕竟,蜜月期是按天算的,想要一起生活,那是一辈子的事儿。

历时7200秒(2小时)做完一次预处理之后,我尝试了跑256队列深度的4K随机写数据,结果跑出了一个80万,问题是,官方数据才22万IOPS,那明显不对。

明明测出来是80多万,怎么才标22万,Solidigm也太谦虚了吧!虽然我认为作为Solidigm这个级别的大厂是不会乱标的,但数据差了好几倍??肯定还是我的问题。

咨询了一位工程师朋友,对方告诉我需要再做一次预处理才能确保预处理的效果,确保预处理能进行的比较彻底。

D7-P5520的正式测试跑分

做完这次预处理之后,QD256时候的4K随机写性能达到了26.9万,不同时段测了好多次,每次都稳稳的在24以上万,抖动非常小,全程都比标称的22万多了好几万数值。

而随机读性能则更稳,无论是白天测、晚上测、吃饭测,还是睡觉测,每次测试都稳在85.6万纹丝不动,看来是卡在PCIe 3.0的带宽限制了,此时的吞吐达到了3505MB/s,我见过的PCIe 3.0最多也就这样了。

除了100%的随机读和100%的随机写,常见的还有混合读写,经测试,7:3的混合读写时,读为29.9万,写是12.8万,加起来42.7万IOPS。

众所周知,硬盘分为随机读写和顺序读写两大类,在做顺序读写测试前,还得做一个为顺序工作负载准备的预处理(Pre-conditioning),最好是做两遍。

QD256时,顺序读带宽达到了3578MB/s,IOPS为27.3K。

顺序写带宽为3470M/s,IOPS为26.5K。

无论是读还是写,基本也都触达到PCIe 3.0 x4的极限值,那P5520的主要测试内容就先告一段落。接下来,让我们测一测P5620在PCIe 3.0台式机上的性能表现。

OP一下,P5520一秒变身P5620!开测

实际上,D7-P5520和D7-P5620系列产品的所有SKU均采用相同的NAND、固件以及控制器,认识D7-P5520其实就了解了D7-P5620,两者可以通过设置Over provisioning来完成转换。

Solidigm给出的文档里提到可以用SST(Solidigm-storage-tool)工具做一个OP,最后,通过各种查资料,以及场外求助另外一位工程师,最后搞定了OP设置,一块7.68TB的P5520变成了6.4TB的P5620。

性能会有什么变化呢?

QD256时,4K随机写的IOPS为43.7万,比P5620标称的数值39万高了四万,比P5520高了16.8万!

QD256时,4K随机读的IOPS为85.6万,跟P5520时的情况一样,带宽为3505MB/s,也是顶到了PCIe 3.0X4的带宽瓶颈。

7:3的混合读写时,读为41.4万,写是17.7万,加起来59.1万IOPS,比P5520确实高出大约16.4万。

至于顺序读写就不再额外测试了,反正都会卡在PCIe 3.0×4的带宽上。

最后一点总结和感想

首先,这次测试过程确实加深了我对SSD特别是企业级SSD的认知;

其次,期间查询的一些资料也见识到了Solidigm这种级别的厂商的严谨性和在文档等公开资料方面的积累;

最后,即使是在普通的、旧的台式机上也能有不错的性能表现,可见其兼容性或者适配能力真的很强。在这样的平台都能运行,相信在很多其他英特尔平台的服务器也一样会有不错的表现。