专访声纹专家李海洲，权威解读声纹技术如何有效风控-DOIT-数据产业媒体与服务平台

自2018年10月中国人民银行正式对外发布《移动金融基于声纹识别的安全应用技术规范》，声纹识别技术逐渐得到了各级监管部门的认可，“声纹+”的身份认证方式成为为各领域保驾护航的有效手段。在政府和产业各界人士的共同推动下，声纹识别逐渐走入实际应用，在金融、安防、智慧生活等领域都已经成功落地。

为帮助各大银行机构、公安、终端设备等用户深入了解声纹识别技术的应用与发展趋势，更加高效地利用声纹技术进行反欺诈等风险控制行为，记者联系到声纹识别领域的权威专家——快商通首席科学家、前任国际语音通信学会主席、亚洲自然语言处理协会主席亚太信号与信息处理学会主席、全球声纹反欺诈研究的发起人之一李海洲教授，对声纹技术应用进行全方位的深度解读。

快商通首席科学家李海洲教授

为什么声纹技术可以进行有效安全防范？

李海洲教授向记者介绍道：“声纹识别技术，是用说话人的声音，以逆向工程（reverse engineering）来描述说话人的声道、口腔、口腔容量、声道长度、鼻腔等相关器官的结构和状态。声纹识别具有唯一性、稳定性等特征。” 随着声纹识别率的提高，声纹技术已经在安全，金融，社交，通信平台上进入广泛的商业应用。因此，它的安全性也得到广泛的关注。目前全球对于声纹技术的安全性研究主要集中在“声纹技术的反欺诈”。

对于声纹反欺诈的安全防范方式，李海洲教授认为可以概括为以下几种：

首先是数据学习方法（Adversary training），即通过离异数据训练，使机器学习到真实的说话人数据与虚假/其他说话人数据之间的边界，以数据分布式学习的方式实现反欺诈。

第二是输入确认：声纹先进入非自然语音检测的输入确认模块，排除干扰，保护说话人识别模块。这也是当下较主流的做法。

输入确认

第三是拒接绝对拷贝（录音回放）：每一次声纹输入，都将其绝对拷贝下来。在进行声纹验证时，若对比判断为一致，则该声纹为录音。

第四是检测电磁场干扰：录音回放时会，手机内置扬声器周围的电磁场会受到扰动，指南针随之摆动，据此可判断该声音为回放。

第五是检测物理声波：即通过改变硬件设计达到反欺诈效果。

简单来说，声纹识别技术目前已经能够有效地进行风险防范。李海洲教授已带领快商通团队研究出1:N场景下的身份识别应用。与传统验证方式相比，1:N的识别能在电话端实现远距离、高精度的身份认证与身份反欺诈，只需要一通电话，几秒钟时间就能确定说话人的真实身份。

各领域用户要如何应用声纹识别技术？

以声纹反欺诈进行风险防范，这一方式已被越来越多的产业单位所接受，也逐渐得到各级监管部门的认可。然而，面对一系列诸如《关于加强II、III类银行结算账户风险防范有关事项》的建设要求，各领域用户当如何高效运用声纹技术，使其发挥出反欺诈的最大效能？

这个问题，当与欺诈方式结合思考。李教授表示，欺诈行为一般分为两种：

其一是数据入侵，即黑客进入数据库，并将修改的声纹放入系统中。目前数据入侵分为三种形式。黑盒子攻击，以机器学习的方法来攻击机器学习，无穷尽地向系统输入数据，观察其输出结果，便可得知该系统的数据偏好。白盒子攻击，则是针对已知市场上各系统算法的模型、机制，并倒推其弱点进行攻击。灰盒子攻击结合了以上两种方法，既有机器学习的工具，又了解系统的运作结构。

李教授认为，防止数据入侵，需要技术厂商与企业用户共同努力，主动、及时了解黑客的做法，有针对性地完善声纹识别系统前端安全性。

另一种欺诈行为，则是公检法、金融、社保等各个领域普遍关心的物理入侵。

以金融领域为例，大部分金融机构坏账来源于黑中介主导的产业链式诈骗。因此，在审查环节及时鉴别出黑中介，成为降低消费金融公司坏账率的关键因素。在传统单一身份识别手段低效的情况下，如快商通“远程实时身份认证与身份反欺诈平台”的解决方案毫无疑问成为金融风控的核心。

声纹反欺诈应用流程

在公共安全领域中，声纹反欺诈也能对电信诈骗等问题提供有效的解决方案。针对犯罪分子录音、回放等欺诈形式，可以参考快商通“声纹鉴定工作站”、“声纹侦查作战平台”等方案，有针对性的识破违法行为，进而维护社会治安，保障国家人民财产安全。

声纹技术应用落地，用户最关心什么？

“声纹识别系统鲁棒性和安全性之间的平衡和相关参数的调整，是各大用户关注的重点，同时也是全世界范围内声纹相关厂商现阶段面临的主要难题。”李海洲教授如是说道。

在声纹识别的过程中，传感器和信道的不同、环境的变化以及周围的噪音、说话人情绪、健康状态的变化以及其年龄的增长、不同语言的使用等因素，都会影响声纹识别的识别率，进而降低用户的使用体验与效率。

想要克服这些影响，便需要提升系统的鲁棒性（robustness)，也就是抗变换性，以保障声纹系统在不同的条件下的识别率。但与此同时，还要关注系统鲁棒性和安全性之间的平衡问题。

针对声纹安全系统，目前各技术厂家主流的做法是在声纹识别模块前建立非自然语音检测模块，但这显然牺牲了一定的鲁棒性。而声纹系统的使用者，更希望得到的数据是检测系统的拒绝数量以及正确认证数量，这正是大部分声纹技术厂商现阶段需要突破的问题。

对于这一点，李海洲教授认为，声纹企业当如快商通一般，既研究安全性的提升，也兼做鲁棒性，把自然语音判断和声纹系统相结合，进而得到最优答案，提供完整的系统性结论。

推动声纹反欺诈发展，科技惠民，赋能百业

作为在人工智能领域从事科研工作三十余年的权威专家，李海洲教授曾任亚太信号与信息处理协会 (APSIPA)主席及国际语音通信协会（ISCA）主席，并先后在第四届亚太信号与信息处理协会年度会议 (APSIPA Annual Conference and Summit 2013) 和第十九届国际语音通信年会 (INTERSPEECH 2018)上做了专题报告。李海洲教授对声纹反欺诈的理解和技术积累，在一定程度上推动了声纹反欺诈的国际科技合作和系统评测标准化。

李教授表示，随着声纹识别技术的逐渐成熟以及声纹反欺诈的不断落地，未来会涌现出更多的声纹识别应用场景。如何引导声纹识别技术向着更加产业化、规范化的方向发展，如何合理挖掘应用场景并进行针对性开发，这是快商通作为业内先进企业的责任，同时也是产学研各界未来必须要关注的问题。

“2018年是声纹技术发展的元年，而今年，围绕声纹技术展开的科学研究和落地项目都将会有井喷式的爆发”李海洲教授讲道，金融、公检法等各个应用领域的用户，都要抓住技术赋能产业的重大机遇，改善产业结构，实现智能化发展。

专访声纹专家李海洲，权威解读声纹技术如何有效风控

songjy

相关推荐

近期文章

热门标签