作为一家软件定义存储创业厂商,华瑞指数云做了一件堪称惊天动地的大事情:对于软件定义存储的时代进行了划分,创新提出了叫SDS 2.0的概念。简单地说,就是要把软件定义存储系统的延迟控制在100μs的水平,到不到这个能力的产品,统统归入SDS 1.0时代。SDS 2.0才是先进生产力的代表。
对于SDS 2.0,我一直有一个疑问,华瑞指数云为什么要把一个性能指标作为划分时代的标准呢?这个指标非常不容易记忆,我经常会把μs和ms想混淆,对此,有没有更加简单的划分标准,或者记忆方法呢?
2024全球闪存峰会期间,DOIT总编特邀华瑞指数云CTO曹羽中先生结合相关热点话题进行了交流。
DOIT总编宋家雨(左)特邀华瑞指数云CTO曹羽中先生(右)
结合相关热点话题进行了交流
曹羽中表示:SDS 2.0概念中的一个很重要的关键点在于,我们要看过去SDS的缺陷在哪里,SDS发展十多年,有一个最突出的问题或者劣势就是:存储关键性能指标不行,没有办法跟传统存储相比,这意味着过去的SDS没有办法去承载由原来传统存储能够去承载的企业关键应用,这种先天缺陷,让SDS只能够蛰伏在中低端存储市场,没有办法形成对传统存储的更新换代,做不到这一点。
SDS2.0最重要的目标就是:能够成为主流企业级存储的选择,这是它要解决的问题。
“我们提出SDS2.0,我们的产品在解决了性能问题的基础上,我们希望有更多拓展的,第一、把企业存储架构从过去软硬一体单点式的形态升级为软硬件分离,用存储资源池方式进行交付;第二在云计算和AI新时代,让存储形态和云环境、AI环境更好的融合,承载新一代的应用;第三是数据的智能管理,帮助企业客户做好数据的价值发现。” 曹羽中说。
关于如何具象化的判断什么是SDS 2.0产品,曹羽中表示:高端存储阵列往往是最高可靠性和性能的代表,其IOPS、时延、可靠性非常优秀。SDS2.0就是以高端存储阵列为目标实现了超越,如果你记不住具体的性能指标,你就问一件事情,你选择的SDS存储产品是否在核心指标上可以达到甚至超越高端存储阵列的能力和水平,这就是一个简单且容易记忆的方法。
为什么华瑞指数云在创办企业的时候会找一个我们形容是一个特别难啃的骨头,是传统存储产品最擅长的一个地方?为什么软件定义存储要选择这么一个难啃的骨头,当时怎么考虑的?以成熟的高端存储产品为竞争对手,华瑞指数云不是自讨苦吃吗?为什么要选择这样一块难啃的骨头呢?
“我们并不是特地选择一个最难啃的骨头,这跟我们的愿景和目标是分不开的。” 曹羽中说。
“我们的愿景和目标是创新一套现代化存储架构,能够承载企业全场景业务和数据。全场景就包括数据库以及企业核心应用这块最难啃的骨头。现在我们向业界证明新一代的软件架构,也就是一个分布式架构+普通硬件的组合,已经能够承载全场景业务,最难啃的骨头啃下了,不难啃的骨头就更应该不在话下,我们就要证明这一点。” 曹羽中补充说。
怎么证明华瑞指数云能够啃下了难啃的骨头呢?
这里特别需要说的是SPC-1测试成绩对华瑞指数云的加持。众所周知,SPC-1测试要求非常严格,为了更好贴近用户真实使用场景,SPC-1测试全面模拟了企业关键业务应用场景下的存储负载,以8种IO请求模型及40个存储单元来模拟用户的数据访问,从而涵盖了读写要求极高的吞吐量、敏感的响应时间限制、动态工作负载、大量存储容量需求、多样化的用户场景、数据持久性要求等数据访问特征。为了避免作弊,SPC-1在很多细节上做出了严格限制。例如,在开始评估性能之前, 要求存储系统进行长达8个小时的持续数据写入(简称长稳测试,也即SUSTAIN TEST),其目的就是为了避免存储阵列缓存命中或全闪存阵列初次写入所导致的测试数据虚高,造成失去公正性。
SPC-1有效规避了技术漏洞,让测试结果更加真实可信,因而也赢得了用户的认可和信赖。去年国庆节前公布SPC-1测试结果中,华瑞指数云的SDS 2.0的产品——WDS V3取得了性能测试、KIOPS成本的双第一,其性能超越传统高端存储。引起了业内高度关注。
曹羽中透露,SPC-1作为全球存储领域最公开权威Benchmark测试对于验证产品的核心能力,树立客户信心的作用非常显著,帮助华瑞指数云更快打开了市场,也有助于消除客户对新一代分布式存储技术是否可以用于核心生产场景的疑问,让市场和客户对SDS 2.0的能力有了一个清晰地认知。目前国内已经有一大批客户采购和部署了华瑞的SDS2.0产品,承载Oracle RAC,达梦等核心数据库,或者用于构建内部云平台的高性能分布式存储资源池,支持一大批要求高性能和高可靠性的核心生产业务长时间平稳运行。更可喜的是,目前也有一批国外的用户在测试华瑞指数云的产品,其中一些商业化项目已经开始落地。
如今我们又迎来了AI新领域爆发性的需求,对于存储系统有许多新的挑战。AI是一个存储密集型,IO密集型的业务。首先需要存储提供非常大的带宽和低时延的数据访问能力,目的是用更快的速度把模型和数据加载到GPU里面去做计算,这个过程中需要操作和读取海量的小文件,对存储系统的元数据性能,IOPS和时延的要求也很高;其次要提供非常高的带宽和并发访问能力,用最快的速度完成AI训练时的Checkpoint的写入和读取;更进一步,企业在IT时代需要完成海量多模态数据的统一高效管理和使用,AI对于数据的使用是一个复杂的data pipeline,需要存储系统提供极强的扩展性,高性价比以及便捷的数据访问能力,以应对海量数据的挑战,同时要提供智能的数据管理能力,实现企业生产数据与AI能力的融合。
现有的传统存储阵列产品无法满足AI时代对于数据存储和管理的要求,传统的SDS 1.0同样也无法满足要求,面向AI时代构建新一代存储架构和产品将是一次全新的挑战和机遇,SDS 2.0责无旁贷。
“我们的愿景是构建一套现代化的存储架构和统一的存储平台来承载企业任何场景所产生的数据,不论是传统的基于关系数据库构建的企业核心生产流程数据,各类事务交易型数据,还是在AI时代基于大规模数据处理和智能分析能力所形成的数据,新一代的软件定义存储都将是那个最好的基座,并且是将生产型数据和分析型数据融合统一,结合在一起使用的数据基座”,曹羽中最后总结道。