探索计算机视觉前沿,蚂蚁技术研究院4篇论文入选NeurIPS

近日,世界顶尖AI学术会议“神经信息处理系统大会”(NeurIPS 2022)公布论文接收结果,成立一年的蚂蚁技术研究院共四篇论文被录用,研究成果聚焦计算机视觉技术的前沿问题。

NeurIPS(Neural Information Processing Systems)是全球最负盛名的机器学习和计算神经科学领域的顶级会议之一,讨论内容包含机器学习、计算机视觉、自然语言处理、神经科学等领域,其收录论文代表了相关研究的最高水平,也是未来技术发展的重要风向标。今年NeurIPS共收到 10411 篇论文投稿,接收率为 25.6%。

此次蚂蚁技术研究院中稿的四篇论文,分别探索了神经网络可解释性与深度学习理论、视觉资产的编辑与创造,以及跨模态大规模表征学习等前沿问题。入选论文均来自蚂蚁技术研究院视觉智能实验室,该实验室聚焦下一代计算机视觉方向基础算法的研究,在七月的ICML 2022(国际机器学习大会)上也有两篇论文入选。据了解,蚂蚁技术研究院下设有六大实验室,分别为数据库实验室、图计算实验室、隐私计算实验室、分布式计算实验室、编译器实验室和视觉智能实验室。

四篇入选论文分别是:

一,《Rank Diminishing in Deep Neural Networks》该论文首次对常用神经网络每层的秩进行了实验估计和实证分析,揭示了由深度网络秩递减引起的独立性缺失现象,有望促进对深层神经网络内在原理的理解;

二,《Improving 3D-aware Image Synthesis with A Geometry-aware Discriminator》,该论文提出了3D生成的新范式,生成的几何质量和图片的多视角连续性有了很大的提升,相关研究成果未来可用于内容生成,AR/VR等应用场景;

三,《Improving GANs with A Dynamic Discriminator》,该论文针对生成对抗网络,提出了两种判别器能力动态调节的新的训练方式,判别器能借此获得更优解从而使2D及3D生成器得到更好的监督;

四,《Uncertainty-Aware Hierarchical Refinement for Incremental Implicitly-Refined Classification 》,该论文针对真实环境中语义粒度不确定的问题,动态构建持续学习过程中的语义继承和冲突关系,并以此引导了增量模型的精炼优化方向,在此基础上可推动实现动态模型的按需学习,并根据需要的语义粒度进行特定的层级构建以及学习认知。

值得关注的是,今年蚂蚁集团正式启动数字普惠、绿色低碳、科技创新、开放生态四位一体的ESG可持续发展战略,而此次蚂蚁技术研究院获选论文作者中包含了多位学界专家和高校青年研究人才,从中也体现出开放创新的研究路线。

如论文《Rank Diminishing in Deep Neural Networks》的作者之一是机器学习先驱、加州大学伯克利分校电气工程与计算机科学系教授Michael I. Jordan,他为无监督机器学习的发展做出了突出贡献,曾被Science评为“全世界最有影响力的计算机科学家”。据介绍,Michael I.Jordan现为蚂蚁集团科技智囊团主席。此外,来自中国科学技术大学、香港科技大学、香港中文大学共5名蚂蚁集团研究型实习生参与到了论文的撰写中。根据公开报道,蚂蚁技术研究院今年发布了研究型实习生项目,通过开放蚂蚁集团的真实产业场景及技术资源,给青年技术研究人才提供一线的实践平台,推动产学研融合。

近年来,随着数字化转型的深入和科技引领创新成为趋势,蚂蚁集团持续投入前沿技术,布局隐私计算、区块链、图计算、分布式数据库和绿色计算五大数字化“根技术”,并于2021年成立蚂蚁技术研究院,致力于前沿科技的探索和研究。根据公开信息,蚂蚁集团连续3年科研投入增长率超39%,目前在职员工技术人才占比达63%,在全国工商联发布的“2022民营企业研发投入”榜单中排名全国第六。