国庆节前,华瑞指数云(ExponTech)登顶SPC-1存储测试榜首,我也被存储圈内的朋友打爆了电话,问我ExponTech是什么背景?为什么其SPC-1存储测试成绩那么好?ExponTech是怎么做到的?
SPC-1测试,存储业内的奥林匹克
正如圈内朋友的反应一样,存储业界非常重视SPC-1存储测试,该测试被视为存储圈的奥林匹克。
如果说,奥运会金牌是每一个运动员的梦想。那么对于存储而言,SPC-1测试排行榜首就是存储人的梦想,也代表着其存储产品技术水平和存储厂商的能力,是真正实力的象征。都说是骡子是马,拉出来溜溜,没有金刚钻,是不敢染指SPC-1测试的,更不用想让成绩为企业背书。
那么,SPC-1测试成绩真能说明问题吗?
先给出结论:货真价实!
首先,SPC-1测试要求非常严格,为了更好贴近用户真实使用场景,SPC-1在基准测试程序设计上,全面模拟了企业关键业务应用场景下的存储负载,以8种IO请求模型及40个存储单元来模拟用户的数据访问,这些测试模型涵盖了读写要求极高的吞吐量、敏感的响应时间限制、动态工作负载、大量存储容量需求、多样化的用户场景、数据持久性要求等数据访问特征,比较能够说明问题。
其次为了避免作弊,SPC-1在很多细节上做出了严格限制。例如,在开始评估性能之前, 要求存储系统进行长达8个小时的持续数据写入(简称长稳测试,也即SUSTAIN TEST),其目的就是为了避免存储阵列缓存命中或全闪存阵列初次写入所导致的测试数据虚高,造成失去公正性。
这里所说的存储阵列缓存命中,指的是利用缓存对数据进行存储和保护,当数据压力不够,IO数据访问就可以在缓存执行,数据不落盘,并不能反应存储系统真实使用的情况;所谓全闪存阵列初次写入也是如此,当数据量不大的时候,存储系统的TLC SSD可作为SLC SSD使用,借此提升系统IO数据访问的性能,达到“以偏概全”的目的。
SPC-1长稳测试有效规避了上述技术漏洞,让测试结果更加真实可信。
SPC-1测试排行也和大家更为熟悉的HPC Top500排行形成了鲜明对比。
HPC Top500排行一度被视为国家科技实力水平高低的象征。但其测试方法采用的是LinkPack测试,一种高斯消元法求解一元N次稠密线性代数方程组的算法,用理想的数据模型替代了真实IO数据访问的情况。该方法可以测试HPC计算能力,但与真实应用场景相去甚远。因此,按照LinkPack测试成绩排行,也被专业人士指出是没有办法的办法。
与之相比,SPC-1测试没有此缺憾,能够较为真实模拟实际应用的情况,因此也更能为用户存储产品选型提供依据和指导。
围绕SPC-1测试相关话题
SPC-1测试是一场真正的零和游戏(zero-sum game),也就是说参与博弈的各方,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。
成王败寇,SPC-1测试博弈的各方没有竞合的可能,让人爱恨浇愁。
总有厂商不断挑战SPC-1测试,也总有超越、被超越,超越时得意洋洋、赢者通吃;被超越时,难免产生酸葡萄的心理。所谓SPC-1测试是靠烧钱堆起来的,就是一个比较有代表性的混淆视听的说法。
我们知道,半导体产业发展遵循摩尔定律,每隔18个月集成度翻番,随之带来性能不同程度的提升,达不到翻番,但是30%~40%的性能提升还是有的,也就是说,凭借摩尔定律,18个月后,SPC-1测试的纪录,就应该被打破。另外,SPC-1测试并没有对于集群的规模进行限制,按照存储系统规模横向扩展(Scale out),性能线性扩展的特性,规模越大,SPC-1测试就应该有更好的性能表现,从而演变为一场烧钱的无休止的军备竞赛。这也引发了一个有意思的话题,SPC-1测试怎么看,看什么的话题。
也是先说结论:不能够光看IOPS、延迟等性能指标,也要看KIOPS成本。
KIOPS成本,也就是1000 IOPS的成本,这是SPC-1测试为了预防军备竞赛而设计的重要指标。你可以通过军备竞赛获取SPC-1测试更好的成绩,但是水涨船高,你的KIOPS成本下不来。因此SPC-1测试的KIOPS成本指标,才是用户更应该参考和重视的指标,也更有比较的意义。
ExponTech做对了什么?
ExponTech WDS 在SPC-1测试中,取得了性能测试、KIOPS成本的双第一,引起了业内高度关注。对此,ExponTech做对了什么?
我觉得华瑞指数云CTO曹羽中的一句话比较具有代表性:“ExponTech已经细抠到IO栈的每一行代码!”换句话说,华瑞指数云成绩的取得依赖的是软件能力,并非依托硬件的升级换代。
对于存储系统而言,端到端NVMe设计、RoCE,以及SCM(如Optane)等技术是影响系统性能的关键技术,一个技术阶段都会产生延迟,加起来就是系统的整体表现。如上图所示,ExponTech WDS 最为突出的就是能够将IO协议栈自身的延迟控制在10μs~20μs的水平,这才是ExponTech WDS 技术能力的关键。
如果仔细阅读SPC-1测试的报告,ExponTech甚至没有使用SCM可持久化内存来提升性能,但仍然拿到了优异的成绩,让人称奇!不仅如此,此次SPC-1测试,ExponTech的测试成绩就尽然还超越了集中式存储阵列,这是前所未有的!
我们知道在存储系统类型上有集中式阵列和分布式存储的区分。在以往的工作经历中,我也曾经试图为这两种不同类型的存储,在应用上划上一条界限,很容易想到利用性能这个指标,因为在传统印象中,我们总认为集中式存储性能往往会好一些,分布式存储稍差;但事实上并非如此。
此次ExponTech WDS 的SPC-1测试也正好印证了这一点,WDS属于分布式存储,但其性能却超越了集中式阵列。
此外,还有一些配置指标值得研究,例如存储节点数量、缓存/内存大小、SCM、NVMe SSD数量等的可比性(参见上图)。这里需要说明一下有关计算节点的数量,在SPC-1测试中,有个称为ASU(Application Storage Units,业务应用存储单元)的设计,这里的ASU就是计算节点,负责向被测试设备提供不同类型的压力流量,按照分别提供45%、45%、10% 分工,将不同大小、不同类型IO测试数据对测试系统进行加压。ASU数量越多,则每个节点能够施加的IOPS越小,相反,数量越少,则每个ASU施加压力越大。
NVMe SSD数量和容量也是需要对比的指标。
此次测试,ExponTech WDS 采用了192块大普微Xlenstor2 系列NVMe SLC SSD,单盘容量400GB。与TLC SSD相比,SLC SSD性能优势显著,但价格也稍高,对于KIOPS不利,需要综合设计和考虑。不仅如此,ExponTech与大普微建立了战略合作关系,打造了类似盘控一体化技术设计,也让WDS 能够充分发挥SSD的基础能力,所谓裸金属的性能。
但是所有这些技术表现,也并非全部的答案。
作为一家年轻的公司,锐意进取,后来者居上并不奇怪,这恰恰是创新型企业的特征。作为一家创新型企业,ExponTech的创业团队由前华为云、腾讯、IBM、微软、DELL EMC等团队的核心研发负责人、首席架构师等顶级技术专家组成,ExponTech的愿景是颠覆性存储软件技术革新,开创数据存储技术和行业的新格局。
在ExponTech看来,存储是一个千亿级的市场,但现有存储产品存在着架构老化,性能不足,安全性差的问题,为此,ExponTech将通过原创自研下一代技术率先突破,抢占市场先机。
此次登顶SPC-1测试榜首,也仅仅是ExponTech小试牛刀而已。
小结
在电影《中国女排:夺冠》中有一段郎平的精彩独白:曾经一位外国记者问我,你们中国人为什么这么看重一场排球比赛的输赢?我说,那是因为我们内心还不够强大,等有一天我们的内心强大了,我们就不会把赢作为比赛的唯一的价值。我们这代人是苦过来的,做什么事情身上都背着沉重的包袱,过去的包袱由我们这代人来背,你们应该打出你们自己的排球。
中国存储何尝不也是如此!
上一代中国存储人的使命是赶超,需要SPC-1测试背书;但是对于新一代中国存储人,内心已经足够强大,登顶SPC-1测试榜首更多是一种能力的展示。专业人能够做专业的事情,ExponTech要开创数据存储技术和行业的新格局!
这就是自信!
对此,感受到了吗?!