创历届最好成绩 阿里云6篇论文入选全球网络顶会SIGCOMM2022

8月29日消息,国际权威网络顶会SIGCOMM 2022近日在荷兰举行,55篇顶级学术成果出炉,阿里云共计有6篇高质量论文被主会收录,占总数10%以上,创下了国内历届参会企业的最好成绩,同时力压谷歌、微软等巨头,成为本届入选论文最多的科技公司。入选的论文包括阿里云自研的下一代高性能RDMA网络协议Solar、端网融合可预期数据中心网络架构、可编程网络稳定性保障系统等。

阿里云基础设施网络负责人蔡德忠在SIGCOMM2022上发表“可预期网络”主题演讲

始于1977年的ACM SIGCOMM是计算机网络领域资历最老的顶级学术会议,对论文的质量和数量要求极高,采用双盲审稿,每年录取率在10%-20%之间。被SIGCOMM录用的论文大多数都会被广泛引用、具有非常大的影响力,从计算机教科书里的TCP/IP网络协议到云数据中心经典架构,SIGCOMM见证了众多计算机网络关键技术的诞生与发展。

从2019年开始,阿里巴巴已连续4年累计16篇论文入选SIGCOMM,是国内被收录数量最多、质量最高的科技公司。而在2019年之前SIGCOMM近50年的历史中,来自中国大陆的企业和高校总共也仅有10余篇论文入围 。

本次入选的论文集中在网络技术在云端场景的应用和创新上,比如Solar是阿里云打造的下一代高性能RDMA网络协议,可将阿里云块存储IO延迟降低20-69%,单CPU核吞吐提升78%;Predictable uFAB是端网融合可预期数据中心网络架构,可微秒级别保障租户的可达性、带宽和延迟;Meissa是大规模全覆盖的可编程网络正确性测试自动生成系统,可将边缘云网关研发测试的覆盖率从30%提升到100%;GSO-simulcast是下一代音视频会议全局多流码率调度系统,帮助视频卡顿率降低35%,音频卡顿率降低50%,会议满意度提升6%;GRTN是全球音视频传输网络项目,提供音视频传输技术的优化和服务保障;Zhuge则是针对即时通信和音视频应用的WiFi网关路由调度框架和算法。

SIGCOMM2022  Technical Session:Programmable Data Planes

“过去数据中心网络的协议和架构都是为传统IT workload而设计的,面对人工智能、深度学习等浪潮,网络性能严重影响了算力集群的大规模扩展,数据中心网络技术亟待变革,” 阿里云基础设施网络团队负责人蔡德忠在大会上表示,阿里云在过去5 年大规模部署RDMA高性能网络实践基础上,在业界首创了端网融合技术体系,并进行了一系列技术创新,打造了可预期网络新型架构,能够提供微妙级网络延时,以及带宽保障,高效支撑万卡级规模GPU算力集群。

自提出做深基础战略以来,阿里云陆续推出了自研芯片、磐久服务器、交换机、光模块、数据中心内RDMA网络等,完善云基础设施的最后一环,实现了以飞天操作系统为中心的双向生长,从芯片、部件到整机的技术创新和全栈自研。今年年初,阿里巴巴还入选了AI2000评选的全球十大计算机网络研究机构,紧跟麻省理工学院、斯坦福大学、微软、谷歌等。