由NVIDIA Quantum-2交换机、ConnectX-7网卡和BlueField-3数据处理器DPU(数据处理器)组成的400G InfiniBand网络Quantum-2平台让人印象深刻,我曾经借用用王朔《动物凶猛》的小说来概括,就像“不管天不管地” “请勿靠近”的“生不愣子们”“不吝秧子的主儿”,“一切都无须争取,我只要等待,十八岁时自然会轮到我”的那群军区大院的孩子,荷尔蒙爆表的备受,燃烧的是无尽的青春。
激情需要的是正确引导,Quantum-2平台最需要的是物尽其用,如何用好Quantum-2交换机、ConnectX-7网卡、BlueField-3 DPU的能力?在采访中,英伟达网络事业部亚太区市场开发高级总监宋庆春给出了答案。
首先是利用ConnectX-7网卡、Quantum-2交换机自身所具有的计算能力,对CPU有关通信处理的部分进行卸载,对类似GPU Driect RDMA、动态路由技术等提供支持。
以GPU Driect Storage为例,在有关AI的应用中,就可以让GPU和存储之间直接建立联系,直接读取数据,避免CPU的参与,提高数据传输的效率; 而动态路由技术,可以有效避免网络拥塞的出现,提高网络传输的水平。Quantum-2交换机的计算能力,可以用于数据汇聚,减少网络中的数据传输量,提高的网络的性能。
网络自身的计算能力不仅限于改善通信,同时也有助于解决多租户应用所导致的云计算资源性能冲突问题,对性能进行有效隔离。这也并不难理解,类似动态路由技术,可以预先洞察可能存在的网络拥塞,通过合理的调度,确保多租户情况下,性能的保证和隔离。
网络自身计算能力毕竟有限,也是因为如此,BlueField-3数据处理器DPU(数据处理器)很好填补了空白。我们可以利用DPU的计算能力,来解决通信的问题,对于CPU进行卸载。与此同时,也可以将其用于解决安全的问题。
以DPU为基础,借助NVIDIA提供的DOCA 1.2 零信任安全框架以及其他的高级零信任安全功能,利用其中的库及容器化服务,如软件和硬件认证、硬件加速的线速数据加密、分布式防火墙、智能遥测以及策略执行,开发人员就可以实现各种基于角色的访问控制和微服务,实现租户之间的安全隔离等安全应用。
为帮助开发人员,NVIDIA提供了一个具有深度学习能力的网络安全框架——Morpheus,其最新版本使用无监督机器学习的方式来创建百万到千万级数字指纹,以有效地检测网络入侵。
Morpheus 中采用了 NVIDIA RAPIDS 框架来进行对于大量的遥测数据的分析,采用 NVIDIA 的AI 框架来对于数据进行训练及生成预训练模型,使用NVIDIA Triton 框架进行推理并生成新的策略,新的策略将被传给 NVIDIA DPU 进行执行,使企业能够及时检查其数据中心网络中的所有遥测数据。
都说“青春无极限”,有什么想做的就要去做,有什么梦想就要去追求实现。这是一个InfiniBand、BlueField DPU的时代,如果这些凶猛的“动物”让你无所适从,那么答案也很简单,你可以在通信、零信任网络安全等方向上发力,千万不让青春虚度!
你有方向和目标了吗?!