近日,在NLP(自然语言处理)领域的顶级赛事LIC 2022语言与智能技术竞赛中,商汤科技研究院NLP团队携手香港中文大学团队,在王历伟教授的指导和带领下,从超过500个注册队伍中脱颖而出,斩获视频语义理解任务冠军。这也是商汤科技在人工智能学术领域获得的又一项超高含金量的技术殊荣。
语言是人类信息传递最重要的媒介,让机器理解语言并进行交互是人工智能的基本挑战。作为由中国中文信息学会(CIPS)和中国计算机学会(CCF)主办的NLP学术竞赛,LIC已连续成功举办五年。本届LIC覆盖自然语言处理和人工智能领域的重要前沿课题,设计了围绕跨模态、知识驱动、可信学习等方面的四大任务,难度相比往届也进一步提升。竞赛吸引了包括腾讯、阿里巴巴、清华大学等在内的学术界、工业界的知名研究者和开发者约3000余名选手共同参与,展开激烈角逐。
本次竞赛的视频语义理解任务包含分类标签预测和语义标签预测两个子任务。在分类标签预测任务中,商汤NLP团队利用预训练模型和类Transformer结构对不同模态的数据进行编码和融合,并进行了数据增强和模型融合,出色地完成了视频中两个级别的标签分类。在语义标签预测任务中,商汤NLP团队提出了将命名实体识别模型和标签分类模型结合的方案,经过创新地数据增强和模型融合后,不仅可以发掘文本中存在的标签,还可以提供额外的标签预测。凭借在多模态和NLP领域的不断积累和创新能力,商汤NLP团队在这两个子任务中均摘得桂冠。
随着人工智能技术的发展以及在不同场景的快速落地,NLP领域的需求和应用越来越广泛,重要性日益突显。例如在数字人领域,语音语义理解是数字人“AI大脑”的重要组成部分。基于语音识别(ASR)、语音合成(TTS)、自然语言理解(NLP)等技术组合,结合商汤所积累的语音语义理解和生成能力,以及知识库自动学习和模型训练能力,可以根据不同行业业务需求,快速定制AI数字人的智能语音对话和问答系统,并可通过接入后台运营管理平台,支持知识库的在线更新和维护,实现AI数字人的深度学习和迭代升级。依托深厚的技术积累,商汤数字人解决方案已覆盖超过200款手机、平板电脑、AR/VR眼镜、智慧大屏及线下一体机等多种终端设备。在不久前知名研究机构沙利文联合头豹研究院发布的报告中,商汤被列入数字人领导者阵营。
自成立以来,商汤科技长期持续投入引领全球的人工智能技术研究,不断斩获佳绩,积累了深厚的技术基础与人才优势。目前,商汤已在各项全球竞赛中已获得70多项冠军,发表超过600篇顶级学术论文,拥有8,000多项人工智能专利及专利申请。商汤科技还前瞻打造了行业领先的人工智能基础设施SenseCore商汤AI大装置,为技术研发和落地提供重要支撑,并帮助研究人员快速实验并验证新的想法,加速创新与迭代。
通过凝聚顶尖人才,持续打造更具扩展性、更普惠的人工智能软件平台,商汤未来将更加高效地推动前沿AI技术的创新转化和落地应用,更好地满足多领域、多场景的产业应用,为学术及产业界发展贡献力量。