京交会 |捷通华声:全方位AI技术,让人和机器流畅交互

5月29日,2019年京交会中关村AI产业应用与发展论坛在京成功举办,近百位来自学术界、产业界的大咖齐聚一堂,共话人工智能产业化发展之路。作为全方位AI技术融合应用的开拓者,捷通华声受邀分享AI技术让机器“能说会听、能思考会判断”的产业应用经验,现将捷通华声总经理武卫东的发言整理如下。

主持人:李卓桓,谷歌机器学习开发者专家,微软人工智能最具价值专家。

圆桌论坛嘉宾:武卫东,北京捷通华声科技股份有限公司总经理,毕业于清华大学,近20年一直从事于人工智能的产业化应用 。

主持人:武总,您好!咱们捷通华声目前有哪些核心技术,主要应用于哪些领域。

武卫东:捷通华声是一家从事全方位人工智能技术研究和产业化应用的公司。2011年,我们推出了全国首个全方位人工智能开放平台——灵云(AIcloud.com),并将捷通的智能语音(语音识别,语音合成,声纹识别,麦克风阵列)、智能视觉(OCR,手写识别,人脸识别,指纹识别,视频识别 )、智能语义(语义理解,自然语言处理,机器翻译)、大数据分析等13项AI技术在灵云平台上面向产业全面开放。我们想通过全方位AI技术,赋能百业,构建人工智能产业生态。目前,我们的AI技术已广泛应用在金融、电信、能源、政企等各行业、各领域,服务上千家企业。

主持人:我们都知道,AI产业发展及商业变革,不仅仅依赖于技术的突破,更重要的是落地场景的实际应用。捷通华声作为一家全方位AI技术研究与产业化应用企业,提出人工智能让机器“能说会听、能思考会判断”。请武总分享下,捷通华声这方面的应用水平到了什么样的级别?解决了哪些行业痛点?

武卫东:我们当时提出“能说会听、能思考会判断”,是想让人和机器之间,或者机器与机器之间,能像人与人一样流畅沟通。

要实现“能说会听、能思考会判断”,就必须要多项AI技术融合应用,所以我们当时提出要打造全方位人工智能技术,尽管学术界和产业界有很多人质疑。

现在看来,很多产业应用,要求多项AI技术融合服务。很多发展不错的AI公司,也在向全方位AI发展。从这一点来说,我们非常欣慰,经过近10年的努力,我们灵云平台,已经完成全方位人工智能,且很多产品已融合应用多项AI技术。

举个例子,我们2000年做语音合成技术,应用很广泛,金融、交通、通讯、医疗等领域市场占有率很高:在呼叫中心,用语音合成(TTS)给用户播报信息;在高铁站,TTS用来做列车广播通知,全国高铁全部用的是捷通的技术。

单项TTS技术,代替了人工播报,减轻了人的负担。现在,我们通过多项AI技术融合应用,能为企业大规模地节省人工成本,实现省力、 省心、省钱。

分享个典型的案例,我们给国内排行前三的某大型保险公司,做了国内最大的给上万坐席同时提供实时话术辅助的智能语音分析系统。这套系统,首先解决了过去通话无法结构化的问题,应用语音识别将通话全部转为文字;其次,通过智能质检,将通话质检率从过去的5%提升到100%,有效提升了坐席的服务质量和服务效率,真正实现为企业省力、 省心、省钱、增效。

目前AI技术产业化应用,还在不断创造新的产品,但AI技术的提升,最近学术界和产业界都开始冷静的思考:人工智能,计算能力,可以通过GPU来解决;算法能力,例如深度学习,看到了一些天花板,需要我们更多的数学家来突破。因为AI产业应用市场是非常巨大的,所以我很有信心,全方位人工智能技术的融合,一定会在越来越多的场景落地。

主持人:非常感谢武总,对全方位AI技术融合应用的宝贵分享,相信大家对AI产业发展及商业变革有了更深刻的见解。相信20年后人工智能可能已经很普及并且能够大大地造福人类,那今天在坐的各位老师大咖们都是人工智能时代的亲历者、创造者。如果假设现在您从20年后,回看现在,您最想对现在的自己和我们的同行们说的一句话是什么?

武卫东:20年后,我们生活中的每一个行为、每一个动作,背后都可能有人工智能技术辅助或帮我们完成,让我们的生活更便捷。

“灵云智会系统“入选2019年人工智能新产品

京交会现场,声音嘈杂,参观者体验灵云语音识别,识别率极高