腾讯云首推一站式语音解决方案,助力网络音频健康发展

针对网络音频乱象,腾讯云近日基于领先的深度学习和人工智能技术推出了一站式语音解决方案,该方案能够精准检测和识别网络音频中存在的色情呻吟、谩骂、暴恐、违规广告等不良信息,助力应用服务商有效解决网络音频乱象,促进网络生态健康发展。

新推出的腾讯云一站式语音解决方案是在原有游戏多媒体引擎GME的基础上,作了功能迭代和性能优化,技术层面融入腾讯天御的AI内容审核技术,通过专利算法对海量音视频数据集深度学习,使其能够更安全、更稳定、更便捷的为多行业、多场景提供一站式语音服务。

近年来,除了图像和视频形式之外,色情、谩骂等违法违规信息也以音频形式在各大平台快速传播,给用户和众多软件服务商带来巨大的困扰。一方面,面对海量的UGC内容,大多数网络音频平台缺乏相关技术支持,无法投入大量的资源和人力进行审核;另一方面,即便少数平台具备检测识别技术,也难以应对海量业务需求,时效性和准确性无法得到保证。

针对这些不良信息和行业乱象,腾讯将历经海量内部业务验证过的内容安全技术,通过腾讯云对外开放。尤其在国家网信办整治网络音频乱象的背景下,腾讯云一站式语音解决方案强大的语音过滤能力,基于领先的音频关键词唤醒、呻吟声识别、音转文、声纹识别等关键技术,不仅能够对色情呻吟、谩骂、暴恐、违规广告等不良内容进行有效识别和过滤,并支持平台根据自身业务需求实现精准化、定制化识别。

目前,腾讯云一站式语音解决方案单日检测违规样本达到上千万条,识别准确率超过90%。并且已经在游戏、语音直播等行业得到了成功应用,为众多用户提供了优秀的语音服务。

拿目前火爆的萌系生存射击游戏《香肠派对》来说,作为一款久居TapTap榜单前列的游戏,Q版的香肠主人公吸引了大批玩家。在游戏进行时的实时语音交流中,部分不文明玩家会出现谩骂和违规广告等行为,严重影响用户体验和游戏运营。在使用了腾讯云一站式语音解决方案的语音过滤功能后,游戏方只需接入SDK,即可轻松对语音内容进行实时识别,并将发现的不良信息及时通知游戏运营方。让玩家在畅玩游戏时不再受到粗言秽语的影响,游戏体验更加舒心,游戏环境也得到了净化。

在娱乐社交场景下,语音直播社交应用同样面临着不良语音内容的困扰,以及对高品质语音听感的诉求。腾讯云一站式语音解决方案支持的48Khz超宽频音质,为用户提供高音质、高稳定的房间内音乐播放、实时唱歌和多人语音体验等多种功能;同时,面对海量的音频信息,平台方通过接入语音过滤功能,将人工审核变为系统自动检验,检验结果还可主动回调,通知平台方。人力成本得以大幅缩减,并能够最大限度规避风险。

值得一提的是,应用接入也非常简单,用户既可以接入SDK(目前支持移动端、PC端、Web端跨平台互通)实现实时语音,再通过实时语音服务器上传给语音过滤服务器,也可以直接上传音频至语音过滤服务器。无需繁琐的操作和大量的人力投入,即可轻松获得过滤结果。

腾讯云一站式语音解决方案接入方式简单便捷

事实上,腾讯云一站式语音解决方案的功能远不止于此,作为一站式语音平台,还可以提供游戏内实时语音聊天、3D实时语音、离线语音消息及语音转文本等功能。

实时语音功能支持超大房间和陌生人喊话、跨队员发言和权限管理模式,通过专利算法消除回声和环境音,还原清晰音质,为游戏、直播等行业用户提供更优质的语音通话体验;3D实时语音基于HRTF、3D空间处理技术以及针对距离的EQ补偿技术,将无方位感的语音虚拟为带有空间位置信息的声源,为游戏玩家带来沉浸式的游戏体验。此外,离线语音功能为全球用户提供120种语言的语音转文字服务,让语音交流无国界。