网易科技 发表于:14年01月29日 10:14 [综述] DOIT.com.cn
据国外媒体报道,据高管透露,英特尔的语音识别技术无需基于云端处理,在响应上将比Siri更加快速。
当下的语音识别系统的问题是:太过缓慢。任何使用过苹果Siri或者谷歌语音搜索的人想必都有这种体会,有时候即使是很简单的指令它们都需要用户等待很长一段时间。
问题并不是出在语音识别软件本身,这类软件的准确度可以说已经达到空前的水平。问题就在于,从计算角度来看,语音识别仍是一项极具挑战性的难题,各大移动平台,不管它是来自谷歌、苹果还是微软,都必须先将你的语音录音压缩包传送到数百甚至数千英里以外的服务器。在那里,比手机或者游戏主机强大的计算机会将语音录音转成文本或者指令。正是这一往返过程致使多数设备上的语音识别非常缓慢,尤其是使用较慢的蜂窝网络的设备。
自推出Android 4.1系统以来,谷歌一直都有提供线下语音识别功能,但它仍处于实验阶段,还没推向非谷歌应用开发者。此外,谷歌对话搜索部主管斯科特•霍夫曼(Scott Huffman)透露,虽然Android可以对语音指令进行一些线下处理,但这种操作在准确性上远不如常用的云端处理做法。
英特尔想要直接在手机处理你的语音,而不是经由云端。
英特尔可穿戴技术主管迈克·贝尔(Mike Bell)近日接受Quartz的独家专访时透露,公司有一解决方案。英特尔与一家第三方公司合作将后者的语音识别软件整合到英特尔强大的移动处理器上,该处理器能够解析人声,而且体积够小,无需经由云端处理。这一方案的产物是一名为“Jarvis”的无线耳机。Jarvis能够同时充当语音控制器和个人助理,既能收听指令,又能作出回复。
英特尔的语音识别解决方案在响应上比基于云的竞争产品更加快速,还支持离线使用。
语音识别功能进入台式机已有好几年,不过手机、其它移动设备和可穿戴产品的处理器都还不够强大,无法直接处理语音指令。英特尔宣称,其为服务器和PC打造强大微处理器的技术让它在开发移动处理器上占据独特优势。
贝尔称,英特尔正向一些手机厂商出售它的语音识别技术,帮助它们实现差异化,带动产品销售。
该举的结果可能会是消费者能够用上可以进行实际对话的语音识别设备。那或许意味着给手机发出像“给迈克发邮件”这么简单的指令的时候,它也会问你你指的是哪个“迈克”。人们将有望用上《钢铁侠》中描绘的那种人工智能对话系统——将计算设备变成真正的个人助理。