第43届语音信号处理领域顶级学术会议IEEE ICASSP 2018于4月20日在加拿大卡尔加里闭幕。
在本届会议上,阿里巴巴不仅有5篇来自同一个团队的论文被收录,5位论文作者受邀在大会做报告,而且举办了“阿里之夜”WorkShop,近距离向论文合作者、研究院所专家学者系统展示了阿里在语音技术上的最新研究内容和多项落地应用。
ICASSP是国际声学语言和信号处理的旗舰会议,和InterSpeech会议并称语音信号处理领域的双雄,每年都会吸引数千名全球各地的语音信号领域和人工智能领域知名专家、学者、企业和开发人员参加。
由于ICASSP是2018年语音领域的首场旗舰级会议(InterSpeech将于9月召开),所以其学术研究方向、科技成果转化内容和产业发展趋势倍受关注,甚至会议内容被业界誉为“风向标”,会影响未来1~3年的技术走向。
三个场景展示阿里语音技术内容
阿里巴巴在ICASSP会议上将通过三个场景展示语音技术内容:一方面5位论文作者将在主会以Oral&Poster形式介绍阿里在语音信号处理技术上的最新技术研究内容;其次在会展核心区展示语音核心技术、语音主要产品、语音应用场景和效果;最后的场景也是相对高规格和私密,通过“阿里之夜”WorkShop近距离系统化介绍语音技术和人工智能技术。
本届ICASSP收录的5篇论文全部出自机器智能实验室智能语音交互团队,论文主题包括“语音合成的深度前馈序列记忆网络”、“使用说话人少量数据来合成语音的自适应算法”、“针对影视作品的语音情感识别信息融合框架”、“高级长短期记忆网络:关于更优时间依赖性刻画在情感识别方面的应用”、“基于深层前馈序列记忆神经网络的大词汇量连续语音识别”,涉及语音合成、语音识别、情感识别等声学语言和信息处理方面的创新方法。
这些论文提到的创新方法相比传统算法模型、网络框架以及循环神经网络(RNN),在效率、性能方面有不同比例的提升。
ICASSP阿里巴巴展区
“阿里之夜”是阿里里巴巴在学术会议上举办的WorkShop品牌,目的是搭建全球学术合作桥梁,构建全球产学研合作共同体。活动采取定向邀约制,参与人包括会议成员、合作机构专家、论文作者等。“阿里之夜”已成为阿里巴巴参加国际学术会议的品牌活动,在业内具有广泛影响力。
阿里巴巴资深技术专家田野在“阿里之夜”现场表示,阿里巴巴不仅注重基础科学的研究,同样重视技术与市场的融合。技术赋能用户、赋能阿里的商业发展,释放技术红利价值,是阿里巴巴对技术与商业双轨制发展的系统思考。
ICASSP阿里之夜WorkShop现场
阿里巴巴语音技术的标志性应用
2016年9月13日,浙江省高级人民法院开庭现场,用智能语音识别系统同步记录了庭审中法官和诉讼参与人说的每一句话,在投射到LED屏幕时系统还不时自动纠错,整体识别准确率达95%以上。这项语音技术由阿里巴巴提供,这也是语音技术首次走进法院,承担起“书记员”的角色。该应用的落地,加快了中国法院将人工智能技术引入办案系统的进程。
2017年7月,阿里巴巴A.I. labs发布了首款智能音箱天猫精灵X1,双11当天售出了100万台,在2018年新品发布会上,阿里巴巴公布天猫精灵共售出200万台,直接让200万个家庭体验到了人工智能与生活结合后的乐趣。
另一个标志性事件是在去年11月,刚刚从乌镇参加完世界互联网大会的马云,在上海的申通地铁上用语音交互的方式购买了一张地铁票,阿里由此成为世界上首个掌握公共场所强噪音环境下实现语音交互技术的企业。通过语音实现购票这一商业场景,主要得益于语音智能团队融合智能语音、计算机视觉等能力,并首次在公共场所嘈杂环境下,突破免唤醒主动语音交互、强噪声环境下高精度远场语音识别等核心关键技术。
马云<右二>在上海地铁体验语音购票
从赋能用户角度看,阿里巴巴正通过云计算、AliGenie等开放平台,向文娱、地产、酒店、旅游、法院、航空、制造、新闻等行业提供智能语音解决方案,加速人工智能技术赋能产业与商业发展。
无论是赋能用户,还是赋能阿里商业体系,都得益于阿里在技术上的突破,在今年全球首场人工智能会议AAAI上,阿里巴巴就有11篇论文入选。在2017年,阿里巴巴 不仅获得ACM MM2020会议主办权,成为首个获得主办权的中国企业,城市大脑成为首批入选国家新一代人工智能开放创新平台的人工智能技术服务,而且在学术领域收货颇多,在IJCAI会议上,阿里巴巴有11篇论文被收录,CVPR会议收录4篇、KDD会议收录5篇,ACM MM会议收录3篇。
近几年,阿里巴巴一直在加大技术研究,以实现在基础科学和颠覆性技术上取得进展。为此,阿里巴巴成立全球性技术研究机构“达摩院”,未来三年在技术上总投入将超过1000亿人民币,涵盖机器智能、智联网、金融科技等多个产业领域的技术研究内容。