Cavium李晓苏:NVMe网络协议发展趋势

12月5日,由DOIT传媒、存储在线和中国计算机学会存储专委会联合主办的2017中国存储峰会在北京盛大开幕。本届峰会以“数据中流击水,浪遏飞舟”为主题,吸引来自政、企、产、学、研、媒体等各方参与者超过2000人,观看在线直播观众超过7000人。

本届峰会对中国及全球存储市场现状及发展趋势进行了深入解读,与此同时,业界领袖及学术专家一致认为,从信息时代走进智能时代,数据已成为企业的重要资产。作为数据生存之地,存储在数字经济中将发挥基石作用,只有解决了存储的问题,才能通过数据创造出更多的商业价值。因此,如何让存储更敏捷,如何依靠软件定义和闪存技术实现存储产业的转型升级,成为与会嘉宾备受关注的话题。

Cavium技术经理李晓苏在2017中国存储峰会上发表主题为《NVMe网络协议发展趋势》的演讲。

以下为嘉宾演讲内容整理:

李晓苏:

这个是我今天要讲的目录,我会集中讨论一下现状和趋势。说起NVMe大家都知道,目前非常火爆,大家基本上天天在讨论。从磁盘的技术发展开始,我们可以看得出来,从最早1950年磁盘发明出来,磁盘的发展一直朝更高的容量,更快的速度发展。现在在NVMe的情况下,我们专门针对闪存有了协议,使其最大限度发挥出闪存的威力。

这个是NVMe协议的路线图,大家可以从中间看到,这是NVMe的主协议,下面是它的管理接口。

未来的发展方向,也就是下一个大的版本会在2019年推出,也会有相应的新的特性。我们认为在2019年,我们会关注以下这几个方面,更高的扩展性、多路径的支持,以及更多网络类型的支持。

我们现在有哪些网络呢,这个是我们的现状,大家非常清楚,我们所有目前的NVMe的磁盘也好,都是构架在PCle上面的。

RDMA大家从字面翻译可以非常清楚的明白它的含义,就是远程的直接内容访问,我们本地的网络节点可以穿越远端层,更快访问我们所需要的数据。

RDMA技术:iWARP 2007互联网工程工作组(IETF)标准;在TCP/IP上运行、RoCE 2010 lnfiniBand 行业协会。

RDMA-iWAPR和RoCE的区别:由于L3/L4间的区别,iWAPRP和RoCE不能互相传输RDMA流量

iWAR和RoCE的区别。

iWARP:采用TCP/IP作为传输协议。不需要无损以太网(BCB/PFC)就可以运行。在企业、数据中心和多站点环境中提供无限的可扩展性。

RoCE:比iWARP更轻量的协议(L2与L3)。高性能计算(HPC)所需的更低延迟。

要求无损以太网(DCB/PFC)。

RDMA怎么选择?

生态系统就绪性:软件:大多数操作系统和应用同时支持iWARP和RoCE。第二个我们有没有强大的管理能力。

硬件RoCE:CAVM、MLNX;

iWARP:CAVM、INTC、Cheisio

我们认为Roce和iWARP适合不同的应用场景:RoCE适合小型HPC集群,iWARP适合数据中心规模部署。

FC是占据主导的协议,所以它的设计之初就是为存储设计的,所以FC-NVMe这块,我们的目标是尽可能利用FC现有的更高性能的特性部署我们的NVMe。我们的特色就是在协议设计的时候,可以利用现有的FC HBA和FC交换机硬件。

发送NVMe SQE和CQE条目,而不是很少进行交互。

到了第二步,第一个就是在存储端的磁盘这一块做改变,因为现在NVMe磁盘已经是非常大的产业规模了,这块是第一步,我们先把存储系统的后端变成了NVMe,这样先比传统的SCSI已经有了非常强硬的性能,看得见的性能提升。这块还并不完整,并不完善,因为我们在传输的过程当中依然需要从传统的FCP转换。因此我们认为再下一步变成端到端的,从他访问我们开始就是NVMe的环境。

刚才讲的都是协议层面,我们来看一下Cavium作为IO的厂商做了哪些工作。

首先,我们先了解一下FC。刚才我们讲到网络跟交换机的兼容性,目前还在做的厂商就是跟博科。对于其他的热门厂商比如微软来讲,也会在它下一个大的版本当中加入我们驱动的支持。

网卡支持:QL45000系列/QL41000系列。

速率从100G/50G/40G/25G/10G;

操作系统Linux  upstream  kermel:4.8版本。

在NVMe over  Fabrics 市场上的领先优势:Cavium/Qlogic是唯一同时提供以太网RDMA和FC光纤网络NVMe协议。