英伟达以太网加速 xAI 构建的全球最大 AI 超算,10万块H100
2024 年 10 月 28 日—英伟达宣布,xAI 位于田纳西州孟菲斯市的 Colossus 超级计算机集群达到了 10 万颗 NVIDIA Hopper GPU 的巨大规模。该集群使用了 NVIDIA Spectrum-X 以太网网络平...
2024 年 10 月 28 日—英伟达宣布,xAI 位于田纳西州孟菲斯市的 Colossus 超级计算机集群达到了 10 万颗 NVIDIA Hopper GPU 的巨大规模。该集群使用了 NVIDIA Spectrum-X 以太网网络平...
韩国的Panmnesia公司在2023年闪存峰会(FMS)上也展示了池化的CXL内存系统解决方案,该方案同时包含软件和硬件。 在闪存峰会的现场演示中,该系统运行了类似Meta的推荐应用,结果发现,其性能比基于RDMA的系统快了三倍以上。 据...
用云技术创新,推动RDMA普及
12月21日消息,阿里云发布多款基于自研神龙架构的弹性计算新品,包括RDMA增强型实例、800G GPU超算实例、FPGA计算型实例、GPU图形计算型实例等,在性能方面大幅提升,同时增加了多种服务形态,将计算延伸至客户身边,解决企业在数字经...
清华大学代表在介绍其论文《Gentle Flow Control: Avoiding Deadlock In Lossless Networks》时强调,无论是计算还是存储,分布式系统已经成为了提升性能的必经之路,很多基于分布式系统的应用都需要无损网络的支持。
与评奖、推优相伴相随的是各类大赛。 让我们印象深刻的是HPC大赛,与每半年发布2次的Top 500排行相比,HPC编程大赛冠军归属,也是榜首之外另一个引人关注的话题。 近年来,中国屡次称霸排行榜榜首,中国高校也屡次夺得编程大赛桂冠,中国也赢...
2019年1月26日, 国际高性能计算及人工智能咨询委员会(HPC-AI Advisory Council)宣布,将面向全亚太地区的大学生启动第七届RDMA编程挑战赛 (The Seventh Student RDMA Programmin...
2018年5月22日, 国际高性能计算及AI咨询委员会(HPC-AI Advisory Council) 今日宣布,将面向中国大学生发起第六届RDMA编程挑战赛 (The Sixth Student RDMA Programming Com...
关于 GlusterFS 在分布式文件存储领域,有不少著名的开源项目。GlusterFS凭借其久经考验的稳定性、优异的扩展性、无元数据架构带来的数据可靠性、并发高性能等诸多特点,一直是许多关键性业务的首选文件系统。 上海储迅信息技术有限公司...
前序文章阅读: 《为了部落:NVMe over Fabric诞生记》 《为了部落:NVMe over Fabric诞生记——RDMA篇》 对于NVMe over Fabrics协议来说,要解决下面几个问题: 提供对于不同互联透明的消息和数据...