在《能卸尽卸,DPU让数据为中心应用轻装前进》一文中介绍过,数据正在替代CPU成为数据中心的核心,安全、网络、存储和AI、HPC等应用场景,都可以透过卸载,追求更高的性能和效率。
在欧洲,由DiRA构建并服务的超级计算机系统服务于剑桥大学、杜伦大学、爱丁堡大学和莱斯特大学,这4个超算中心分别侧重于天文学、宇宙学、粒子物理学和核物理学,特点各不相同,有的侧重超大规模计算,有的侧重数据密集型处理,也有的需要密集型内存的处理。总之特点不用,所采用的技术手段也不相同。
针对不同的需求,有的可以从网络入手,透过卸载网络协议,释放CPU处理器的性能,有的可以针对存储,借助RDMA,减少CPU处理器的等待时间。此外,还可以借助具有双精度处理能力的GPU,来承担部分HPC的处理任务。想方设法解决超级计算所面临的:功耗墙、访存墙与I/O墙等问题。
DiRA超级计算机选择了多种 NVIDIA HGX 平台技术加速,包括NVIDIA A100 Tensor Core GPU、NVIDIA HDR 200Gb/s InfiniBand 网络和 NVIDIA Magnum IO 软件。
NVIDIA最新发布的400G InfiniBand网络能够降低60%的功耗,同时提升15%~17%的应用性能。
NVIDIA最新发布的支持PCIe连接,支持HBM2e内存的A100 GPU处理器,能够提供高达2TB/S的内存带宽,借助第三代NVLink的连接技术,为高性能计算性能提升创造了条件。
NVIDIA 网络高级副总裁 Gilad Shainer 说:“DiRAC 正在帮助研究人员揭开宇宙的奥秘。我们与 DiRAC 的合作将利用 NVIDIA GPU、DPU 和 InfiniBand 网络计算加速引擎的优越性能,支持各种相关工作负载,加速前沿科学探索的进程。”
最新一台 DiRAC 新一代超级计算机将采用 NVIDIA InfiniBand 网络技术。
参见:
NVIDIA 赋能英国爱丁堡大学的新一代超级计算机
https://www.doit.com.cn/p/450316.html