能卸尽卸,DPU让数据为中心应用轻装前进

在日前举办的NVIDIA & UCloud线上媒体会上,英伟达网络事业部亚太区市场开发高级总监宋庆春携手UCloud资深技术专家马彦青,就基于DPU构建的新一代软件定义数据中心基础架构展开了精彩演讲。在我看来,核心就是一个充分发挥DPU处理器的能力,能卸尽卸,放下包袱,加速数据为中心应用的发展。

宋庆春指出:传统的冯・诺依曼架构以CPU为中心的时代应该被以数据为中心的时代所代替,原因很简单,数据已经替代计算成为业务发展的核心,数据中心架构应该围绕数据配置资源,计算、存储和网络通信都应该围绕着数据,而不应该以CPU计算为核心。

“数据在哪里,计算就在那里;当数据在GPU上,计算就在GPU上;当数据在CPU上,计算就在CPU上;当数据在网络中传输的时候,计算就在网络中。”宋庆春说。

以OVS(Open VSwitch)虚拟交换机组成的虚拟网络应用为例,使用CPU运行OVS的效率不高,同时也存在长尾延时的问题,原因很简单,通用处理器核处理虚拟网络应用,在网络交互过程中延迟很大,导致效率不高。在这种情况下,就是适合把OVS操作放在DPU,不仅包转发率大幅度提升,同时也实现了OVS操作和CPU业务之间的隔离,大幅降低了长尾延时。

类似的,NVIDIA与VMware合作的Project Monterey也是将ESX的Hypervisor从CPU卸载到DPU上。

在安全、网络、存储、AI/HPC等很多应用场景,都可以使用DPU对于CPU进行卸载,以充分发挥CPU计算的资源,让数据创新应用敏捷高效。  

UCloud基于英伟达DPU DOCA生态,大胆进行了技术实践。 据UCloud资深技术专家马彦青介绍,他们基于NVIDIA DPU使用ASAP2做网络的卸载;使用SNAP/Virtio BLK SNAP来做存储的卸载;使用ARM处理器来做上面服务的编排管理;利用DPI深度包检测功能做正则表达式的算法卸载;以及安全加解密的卸载,包括TLS、SSL以及IPSec这些算法;通过InfiniBand网络以及RDMA做数据的加速传输。

而DPU&DOCA简化了UCloud裸金属的网络架构。原来的VPC网关架构,需要使用很多的网关服务器集群来进行管理,而这些网关集群的成本也更高,而且当跨网关的时候会存在带宽的瓶颈。而采用英伟达的DPU之后,就可以将VPC管理整个集成到DPU内部,OVS包转发以及GRE封装都可以通过ASIC硬件来实现。UCloud原来10G网卡升级到25G,新版可以达到50G。DPU的采用能统一裸金属与快杰主机网络VPC,大大提高连接效率。

这样做的目的只有一个:借助DPU的能力,提高网络通信、数据存储和传输的效率,以及提供安全性保障­­­,从而减少CPU在处理这些任务时的等待和开销。在很多应用场景中,网络、外部数据,以及安全处理能力完全没有办法很好地匹配CPU的计算能力,存在着等待和延迟,如今,借助DPU卸载,就可以轻装上阵,充分释放数据计算的潜力。

针对数据为中心架构的新格局,英伟达DPU不断进阶,继去年发布了第一款DPU产品BlueField-2,今年的GTC上又发布了BlueField-3,会在明年上半年推向市场。从BlueField-2到BlueField-3,它的整形计算能力提升了5倍。BlueField-2 目前为软件定义的网络安全和存储卸载了相当于125 个CPU核的工作量,而BlueField-3则能达到300个CPU核。

为了推动DPU应用,NVIDIA发布了DOCA软件栈,DOCA之于DPU,就好比CUDA对于GPU在AI应用张的作用。DOCA提供了各种各样的技术:深度包检测、安全引导、TLS加密卸载、正则表达式加速,以及一个非常令人兴奋的能力,一个基于硬件的实时时钟,可以用于同步数据中心、5G和视频广播。现在其第一版DOCA1.0已经正式发布了,用户已经可以从官网下载使用。

如果能力足够,DOCA可以让你:想卸载什么,就卸载什么。但是卸载不是目的,目的只有一个:充分释放数据的潜力。