NEC开发出可凭借声音判断事态的声音状况识别技术

近年来,作为安心,安全的举措,在摄像头难以拍摄的地点用声音来判断情况的技术不断开发改进。原有技术是通过在不同环境下大量学习目标音,从而实现声音检测。然而,在大范围检测目标音时,因为混入很多环境杂音,对于远处发生的很小的目标音的检测精度下降,需要在各个环境下学习目标音等,因而难以导入未知环境成为课题。

近日,NEC宣布开发出“声音状况识别技术”,作为NEC最先进的AI技术群“NEC the WISE”的技术之一,该技术可根据声音判断事态。

本次开发的“声音状况识别技术”将麦克风收集到的目标音与环境杂音分离开,使用从目标音中抽取细小构成音的构成音抽取技术与根据构成音的组合模式判断事件有无的事件判别技术,可以从需要辨别的若干事件中判断正在发生的状况。

NEC通过“声音状况识别技术”可以监测公共设施、旅游景点等地的犯罪和事故,也可以实现对老年人的默默守护,总而言之可以在不同环境下高度感知危险状况。

值得一提的是,此技术在国际声音检测大赛DCASE2016中,在噪声中的日常声音检测类别荣获第一名的好成绩。此外,NEC的验证实验也证实,此技术可以检测5倍于原来检测距离的声音。

12声音状况识别技术概要。

新技术的优势:

——可高灵敏地检测细小声音的构成音抽取技术:例如,“玻璃碎了”这种情况发生的时候,因环境而异可能会发出“哐当”“啪”“嘭”等声音。而构成音抽取技术则可提前学习麦克风采集的声音,分成“哐”“当”“啪”“嘭”等不受环境影响的更细小的构成音,将不需要学习的声音划入环境杂音,从而在不受环境杂音影响的前提下抽取构成音。

——可判断发生事件性质的事件判别技术:事件判别技术可以将不受环境影响的构成音“哐”,“当”“啪”以及“嘭”等组合作为新的事件模式提前学习,通过构成音抽取技术高精度地抽取构成音,并进行比对,从而判断是否出现了目标事件。通过这种检测方法,即便是在大范围内也可以在存在各种杂音的环境下高敏感度地检测出微小的声音,且无需逐一学习在不同环境下的目标声音,因此可以轻易导入到未知的环境当中。

13构成音抽取技术、事件判别技术概要。

NEC集团致力于在全球范围内推进社会解决方案,提供安心、安全、高效、公平的社会价值,将先进的ICT技术与知识相融合,为实现更加光明更加丰富多彩的高效社会尽一份力量。