DOIT资讯 2月15日报道: IBM中国研究院专家潘越在新浪微博(http://t.sina.com.cn/1860270543)上在比较Watson沃森和15年前大战国际象棋大使卡斯帕罗夫的深蓝系统,他表示,从硬件上来讲,从深蓝到Watson的计算能力有了巨大的进步,可以说不可同日而语。但“更大的差异还在要面对的挑战和应对的算法方面。”
“国际象棋定义明确,主要涉及数学,电脑可以轻易表示每一个游戏状态及相应步骤。《危险边缘》则要求电脑必须理解人类自然语言。与国际象棋不一样,人类语言完全是开放式的,往往模棱两可,需要上下文才能理解意思。虽然我们可以轻松理解人类语言,但开发理解人类语言的电脑系统却极具挑战性。”潘越在微博上表示,沃森的开发过程十分具有挑战性,而IBM中国研究院的专家也有幸参与了进来。
他表示,在沃森的设计中,自然语言理解是其中的核心问题,特别是如何更快的利用已有的各种非结构化和结构化的知识来帮助自然语言的理解——因为本次沃森挑战的《危险边缘》是智力问答竞赛。要求电脑必须理解人类自然语言。
“这中间又涉及到机器学习、大规模并行计算、语义处理等领域。沃森了不起的地方在于把这些技术整合在一个体系架构下来应对自然语言理解的巨大挑战。”
新浪微博帐号IBM100(http://t.sina.com.cn/1937649537)也在微博中解释了为何沃森不需要联网参加本次智力问答以及为何计算机也会出错,该微博显示,尽管Watson存储了大量的百科全书和其它的信息,但实际上《危险边缘》的问题并不能轻易地在这些信息中找到答案,更不用说按照游戏规则只能提供唯一的答案,而且提供错误的答案要受惩罚。”
“实际上,一般的搜索引擎会得到成千上万个似是而非的答案,而Watson要对所有的答案取得更多的证据支持,然后根据其证据的强度进行取舍并根据其信心决定是否提供答案。这一过程是极其复杂的,因此需要动用上千个核的超级电脑来处理一个问题。”