阿里推出会议AI助理“听悟”,可秒速生成智能会议纪要

10月21日,杭州云栖大会上,阿里巴巴达摩院发布软硬件结合语音产品“听悟”。相比只能逐字转写的上一代语音产品,“听悟”是面向未来会议的AI助理,集成了达摩院最新语音及自然语言处理技术,不仅“听”得准,且“悟”性高,可秒速生成智能会议纪要及待办。

会议场景对语音转文字产品有强需求。但因技术限制,传统语音产品存在“听不准、分不清、看不懂”等问题,往往在噪音下识别准确率较低,无法区分不同说话人,转写内容冗长难以阅读和沉淀。针对痛点,达摩院语音实验室打造了“听悟”,通过让AI深度参与,让线上及线下会议更智能、高效、协同。

“听悟”内置达摩院独创声纹融合方位算法,能对多达10位说话人进行角色分离;融入达摩院新一代端到端语音识别模型,中文识别准确率可达98%,支持14种方言及中英文“自由说”;可嵌入线上音视频会议,实时出字幕及纪要。

除了听力好,这位AI助理悟性也高。 “听悟”能模仿人工整理,进行智能纠错和分段,自动过滤语气词,让生成文本更流畅。同时,“听悟”擅长抓重点,可秒速生成关键词、核心结论、重点内容和待办,用户能同屏编辑、标注摘要、一键分享、安全保存。“听悟”还能对常用词、用户行为及历史文档进行自学习,越用越聪明。

此外,“听悟”配置了智能麦克风,融入达摩院指向性差分麦克风阵列技术,可实现7米内远距离360度高清收音,相比传统麦克风收音距离、抗噪能力大为提升。

达摩院语音实验室负责人鄢志杰表示,“语音技术的发展是不断解锁场景的历史,会议作为当下组织协同的核心场景,是语音AI将变革的下一个重要场景。”

鄢志杰介绍,“听悟”适用于企业会议、金融调研、媒体访谈、教育培训等泛会议场景,目前面向企业客户,已为多家头部金融企业提供服务,且应用于钉钉新上线的“钉闪记”功能中。未来,“听悟”还将探索与会议厂商合作。

IDC报告显示,阿里AI近年在语音语义领域表现强劲,市场年增长率达96.6%,增速第一,总营收中国前二,已深入政务、金融、电商、法律等行业,应用于会议、客服、IoT、搜索、文本分析等场景。