字幕投屏、快速出稿, 人工智能加成下的会议新模式

跟随讲话内容实时呈现字幕,这种以前只在视频剪辑才能看到的现象,正在视频会议以及更多的会场上演。字幕以外,会议内容同时会以投屏形式在会场/分会场大屏幕和线上进行呈现,方便所有与会成员准确获取会议信息。这些场景正是人工智能与会议管理相结合的典型案例,是语音识别、语义理解、机器翻译等AI能力的基础应用。

精准识别会议内容

目前,语音识别技术普遍采用端到端(CTC)语音识别框架和端点检测(VAD)技术,搭配基于Attention的自主研发深度神经声学模型,以确保识别准确率。但产品化过程中,除核心算法还需要丰富的语料训练。综合能力直接影响转写速率以及对方言口音、行业术语、敏感词等内容的转写成功率。

捷通华声为行业客户量身定制的灵云智能会议系统,采用自主研发的语音识别技术。在声学模型方面,采集大量真实录音数据,对不同方言、语种发音习惯,如儿化音、声调等,进行学习训练;在语言模型方面,对各地方言、语种的特有词汇进行专门训练,有效提升了语音识别引擎对口音、词汇的适配能力,进一步提高系统识别率。

灵云智能会议系统可以识别包括四川话、上海话、闽南语、粤语等方言,维吾尔语、藏语、壮语、朝鲜语少少数民族语在内的27种方言语种。

会后快速成稿,支持音字对照

会议智能化还体现在会议纪要整理和输出上,相比传统人工速记或会后录音整理所要花费的大量人力和时间成本。灵云智会可以实时转写发言内容,并通过声纹分角色、手动分角色、麦克风分角色等形式实现话者分离,支持同步编辑及重点内容标记,会议结束后即可快速成稿。

音字对照功能则为会议纪要的确认工作提供了便利。灵云智会在100%完整记录与会人员发言过程中,添加了时间戳功能,会议记录人员能够通过文字快速检索并回听录音文件,对存疑部分进行快速校正和确认。

考虑到一些大型会议,参会人只能自己录音进行转写的情形,灵云智会推出了在线分享功能。参会人员只要访问主办方提供的链接,即可通过手机获取想要的会议速记。

私有化部署,数据安全有保障

常规应用基础上,灵云智能会议系统还提供会议内容语音播报、双语翻译、离线语音转写等多种功能。

灵云智能会议系统采用私有云的方式进行部署,能够为客户提供完整的软硬件环境。数据信息完全保存在企业内部,外界无法收集和查看,做到在物理上管理可控,在软件上确保数据信息的私密性与安全性。