NVIDIA的Quantum-2 InfiniBand交换机曾经让我印象深刻,让我想到了王朔小说《动物凶猛》,“不管天不管地” “请勿靠近”的“生不愣子们”“不吝秧子的主儿”,“一切都无须争取,我只要等待,十八岁时自然会轮到我”,一句话称霸网络新时代。
当时Quantum-2有多凶猛:7纳米制程工艺制造, 570亿个晶体管,多于540亿个晶体管的NVIDIA A100 GPU,具有64个400Gbps端口或128个200Gbps端口,并将提供不同端口数的交换机系统,最多达2048个400Gbps端口或4096个200Gbps端口——交换能力上,超出上一代Quantum-1约 5倍。
有道是:“他强由他强,清风拂山岗。他横任他横,明月照大江。他自狠来他自恶,我自一口真气足。” 尽管Quantum-2凶猛,但诺大个江湖,强中自有强中手。NVIDIA Spectrum-4不会让Quantum-2独善其身。
据NVIDIA网络专家崔岩透露:Spectrum-4以太网交换机采用4N工艺制造,约1000亿个晶体管组成,支持64个800G端口,每个链路400G,共可以支持128条400G交换链路。相比上一代Spectrum-3交换机,在端口密度上更上层楼。
Spectrum-4整体交换带宽达到51.2Tbps,采用全线速无拥塞架构,包转发速率37.6Tbps,可以支持12.8Tbps线速加密,其实加解密对算力、对性能要求是比较高的,在交换机本身这个平台上可以提供12.8Tbps线速加密能力。
崔岩表示:Spectrum-4适于用于现有网络架构替代或整合,它可以达到12台现有以太网交换机的设计,实现同等性能。其 3倍线速加密能力,使得其能够提供更安全的保障能力。其独有的ASIC交换芯片也具有相当节能效果,整体可减少40%的能耗。
Spectrum-4提供了自适应路由的能力。以往多采用在静态哈希设计,一个数据流只能固定一条路径转发数据,易导致链路拥塞。自适应路由可以将交换机多条链路负载均衡到多个链路,当一条链路预测会产生拥塞时,会将一部分数据流量转移到其他链路。
此外,Spectrum-4同样得到了ConnectX-7网卡和BlueField-3 DPU的鼎力支持,稍有不同的是Quantum-2采用InfiniBand协议,而Spectrum-4采用以太网协议。 所谓一山二虎,用户应该如何选择呢?
NVIDIA网络市场总监孟庆表示, Quantum-2更加适用于高性能计算和AI等对性能有极致要求的应用场景,相比起来Spectrum-4以太网交换机更加适用于云计算中心,互联网,Omniverse数字孪生等应用场景。
针对Omniverse、AI等应用,NVDIA提供了OVX服务器、DGX服务器,以及OVX SuperPODS、DGX SuperPODS这样的产品组合,其最突出的特色体现在GPU之间 NVLink高速连接。
此外, NVIDIA发布了H100 CNX融合卡,通过把ConnectX-7集成到GPU卡,它们之间就是400G的沟通速度,从而避免了现有PCIe,200G左右带宽的瓶颈问题,ConnectX-7网卡支持RDMA,具有对CPU卸载能力,从而提高内存数据的访问能力,这一点与NVLink类似,有异曲同工之妙。
Quantum-2、Spectrum-4交相辉映,这是用户的福音。