华为Dorado V6闪存普惠的三个关键词:更快、更稳、更经济

7月24日,华为在京发布新一代智能存储OceanStor Dorado V6。该产品分为6个型号,采用多控制器前后端全互联共享架构设计,其前端通过 FC连接,后端通过100GE RoCE 进行连接。按照控制器数量、控制器缓存、前端接口数,以及最大可热插拔IO模块数,划分为不同的产品类型。

华为存储从2002年开始投入,已经走过17个年头。到今天,全球已经超过1万客户选择了华为存储,在金融、运营商、能源、大企业各行各业的核心系统上都有OceanStor Dorado的身影。在整个存储以及全闪存的市场上,华为在国内保持了市场份额的第一名,同时在全球保持了增长率的第一。

在全闪存的推进上,华为OceanStor Dorado V6将在更快、更稳、更经济上持续发力,加速全闪存的推进,告别机械时代。

在Dorado V6 的设计中,前端共享卡、控制器、后端共享卡三层点对点全连接,通过高效的全连接,实现高可靠,高性能。控制器故障后 1 秒切换,主机链路不断,上层业务无感知。

       在主要处理器的选择上,控制器、SSD盘控等采用鲲鹏 920 等处理器,AI则采用升腾芯片设计。

在一些领域的关键业务应用中,如银行核心交易系统,电信计费系统等,它们要求系统提供高可靠性的服务能力,对于存储IOPS,以及时延有很高的要求。

与上一代产品OceanStor Dorado V3相比,Dorado V6最突出表现在于2000万IOPS以及0.1ms延迟的性能表现,一方面得益于鲲鹏 920 处理器多核处理能力和业界独有的 CoreFarm 智能调度算法,另一方面,也得益于智能芯片昇腾 A310对数据存储的自我加速,特别是对于延迟的控制。

对于存储产品而言,供应商津津乐道的是IOPS,就像高性能计算中的Linkpack测试一样,IOPS成为了衡量存储产品性能高低的重要指标。但是,对于数据库等OLTP等在线交易类型应用而言,高IOPS并不意味着交易处理能力(TPS)强,时延则是影响TPS的重要指标。这也是为什么会有“不谈时延的IOPS,都是耍流氓”说法的原因。

接下来我们看看可靠性,存储控制器的故障是存储系统常见的一类故障。业界存储普遍都能做到1-2个控制器故障的冗余,这是不是就足够了呢,有没有考虑过控制框整体故障/掉电的场景?往往涉及多个控制器同时故障。此时对于客户的核心业务系统来讲,也是不能中断的。华为在可靠性架构设计上更进一步,实现8控制器故障7个业务不中断,有效解决了控制框整体故障的场景。

系统升级在存储生命周期中是常出现的,将系统升级对客户业务影响降至最低是客户的关键需求。业界最佳的能做到的升级能力是2小时以内完成升级,从升级前检查、执行升级到升级后检查,其中业务受损的窗口控制在10秒内。华为在此基础上更进一步,升级做到30分钟内完成,业务受损窗口1秒以内。华为之所以能够在可靠性上取得如此极致的能力,得益于SmartMatrix全互联架构。SmartMatrix全互联架构通过RDMA高速网络,实现了前端IO接口卡、控制器、后端盘框全互联。

华为不仅做闪存系统,同时也自研SSD。为了加速闪存的普及,华为在中国区已发布SSD 1:1替代10K SAS的活动。后续,将持续通过华为独有的深度盘控配合实现SSD更好的成本、寿命与性能,同时通过场景化与算力,实现更好的数据缩减能力,进一步的普惠闪存。