环境噪声、耳语识别有何难?讯飞输入法AI语音输入更懂你

根据相关标准认定,噪声大于85分贝便可认定为噪声环境,这时说话靠“吼”,如此糟糕的环境中输入法语音输入还能正常识别打字吗?相信此前一定遇到过这样的情况:街头嘈杂环境使用语音输入,偶尔会出现“反应迟钝”的现象。这是因为很多语音技术严重受限于应用场景,环境噪音的干扰导致了语音识别效果。在不改变录音设备终端的情况下,只有在软件层面进行优化才能有所改善。讯飞输入法这款神奇的输入法经悉心调教适配各类场景,让语音输入体验再升级!

云图片

据笔者了解,科大讯飞很早之前就已经将噪音抗变换性工作做到了A,I.语音引擎之内。具体来说,在进行语音识别时,讯飞输入法会将待识别的语音处理成与模型训练时相一致的语音特征:实时语音录音先通过环境嗅探区分出噪音环境的分类(车内外噪音、会场音响噪音、地铁噪音等等)。

云图片

具体来说,分领域噪音补偿可基于环境嗅探的知识分辨出各种不同领域,自动采用不同的算法去除带噪语音中的噪音,从而达到提高信噪比的效果;而混合训练技术则可以弥补去噪后语音所产生的同真实安静语音的语谱差异。以此实现噪音环境的识别性能大幅提升,综合形成抗噪解决方案。

云图片

笔者测试,在默认中文“普通话(随心说)”识别模式下,讯飞输入法能够在噪声环境保持高精准的识别效果。

可是话说回来,生活中总有一些地方比如安静的办公场所,会议室或人多的地铁、电影院等公共场合,这时候大声说话来语音输入会显得十分尴尬,那么有没有化解之法?

新版本的讯飞语音输入法(Android和iOS)提升耳语输入的识别效果。顾名思义,耳语输入就是像用“耳语”般使用低分贝音量进行语音输入,即便声音很小也不会影响手机的识别准确率。有了这项功能,就能能决用户在很多场合下使用语音输入不便的痛点,无论安静的办公场所、会议室还是人多的地铁、电影院等公共场合都能继续语音输入。

云图片

特别值得一提的是,讯飞输入法的语音输入已经自适应大声和耳语。在默认中文“普通话(随心说)”识别模式下,点击麦克风对着手机耳语说话,文字立即呈现在屏幕上,如此也不会打扰到周围人,还能继续畅快地使用语音输入。如果你常常因大声说话而尴尬,不妨来试一试讯飞输入法的耳语输入。

作为一家技术驱动型的企业,近十年讯飞输入法一直致力于语言和语音的研究,目前在语音识别、语义理解、机器翻译等方面均取得了行业领先的成果并实现产品落地,此次升级A.I.语音输入引擎,不仅会推动整个行业的技术革新,也意味着科大讯飞在A.I.应用领域的实力达到更高的发展水平。