IBM “Watson”系统挑战最强Jeopardy

1997年5月1日,全世界的焦点集中在一场机器和人的无声的智力大战上。国际象棋大师卡斯帕罗夫最终以25:35的比分输给了一台名叫“深蓝”(Deep Blue)的IBM RS/6000SP计算机,举世震惊。如今,在纽约州阿蒙克市和加利福尼亚州卡尔弗城 —— IBM 和美国最受欢迎的智力竞赛节目® Jeopardy! 近日宣布 IBM 计算机系统“沃森”(“Watson”)将与 Jeopardy! 节目最强的两位参赛者(Ken Jennings 和 Brad Rutter)一较高下。这场有史以来首次人机 Jeopardy! 竞赛将于 2011 年 2 月 14 日至 16 日播出,Watson 将与另两位答题高手连续三天同场竞技。

人脑VS电脑,智力比拼一触即发

Watson 以 IBM 创始人 Thomas J. Watson 老沃森的姓氏命名,由旨在完成一项艰巨挑战的 IBM 科学家团队建造,他们要完成的挑战是建造一个能够与人类回答问题的能力相匹敌的计算系统,要求具有足够的速度、精确度和置信度,并且使用自然语言回答问题。Jeopardy! 节目的设计向这些科学家提出了终极挑战。回答这项比赛中的题目需要分析人类语言中微妙的含义、讽刺口吻、谜语等,这些通常是人类擅长的方面,一直以来电脑在这方面毫无优势可言。

今年秋天,Watson 与前 Jeopardy! 冠军锦标赛的参赛者进行了 50 多场“练习赛”,以此作为它的电视首秀的最后准备。此外,Watson 还参加并通过了普通参赛者需要通过的 Jeopardy! 测试,这使 Jeopardy! 节目制作人相信这场比赛将既有娱乐看点又充满竞争性。Jeopardy! 的执行制作人 Harry Friedman 表示:“我们感到非常兴奋,Jeopardy! 被视作终极知识的标杆,在 Jeopardy! 取得好成绩需要多种技能,我们非常希望看到电脑能否与 Jeopardy! 节目最强的参赛者抗衡。”

这次将与 Watson 同场竞技的是 Jeopardy! 节目最强的两位参赛者。在 2004-2005 赛季,Ken Jennings 打破了 Jeopardy! 的最长连胜纪录,连续获胜 74 场,共赢得超过 250 万美元。Brad Rutter 是单人 Jeopardy! 参赛者中累计金额最高的参赛者,共赢得 3,255,102 美元。总奖金包含 Rutter 在 2000 年首次参与 Jeopardy! 以及三届锦标赛赢得的奖金:2001 年的“冠军锦标赛”、2002 年的“百万美元大师赛(Million Dollar Masters Tournament)”和 2005 年的“冠军终极锦标赛(Ultimate Tournament of Champions)”。

此次比赛的冠军将获得 100 万美元,亚军获得 300,000 美元,季军获得 200,000 美元。Rutter 和 Jennings 将向慈善机构捐献出他们所获奖金的 50%,而 IBM 将向慈善机构捐献出它所获的全部奖金。

IBM科学团队信心满溢,摩拳擦掌

Watson 是一项在问答(也称为“Q&A”)科学领域取得的突破性人类成就。Watson 软件采用 IBM POWER7 服务器,经过专门的优化可快速处理 Watson 必须执行的大量任务,例如分析复杂的语言,以及对 Jeopardy! 问题提供正确的答案等。该系统融合了大量专有技术,能够在满足处理海量并发任务和数据的专门需求的同时,实时分析信息。

在该项目的IBM全球研究团队中,有多位来自IBM中国研究院的研究人员。他们负责为Watson系统采集、分析和使用各种结构化的知识,利用结构化和高可靠的知识提供问题解答,排除让系统显得”愚蠢“的答案,以及帮助Watson系统提高其学习能力。来自IBM中国研究院的很多技术成果已经融入在Watson系统中,而有的研究成果则成为整个科研团队的借鉴和参考。在过去的三年中,IBM中国研究院成为该项目在美国本土以外的最主要的研究力量之一。与此同时,IBM中国研究院将这一珍贵的研究机会与中国的高校进行分享,使得来自中国高校的优秀博士生也能够参与到这一挑战性问题的研究中。

领导设计 Watson 的 IBM 研究团队的科学家 David Ferrucci 博士表示:“经过四年的努力,我们的科学团队相信 Watson 已经能够快速理解 Jeopardy! 问题的内容,分析它需要获得的信息,得到精确的答案,并给出可信的回答。我们对于这场比赛无比期盼,同时也期待着 Watson 的突破性计算能力能够在构建智慧地球以及在业务工作和个人生活等方面给人们提供有力帮助。”

除了参加 Jeopardy! 节目,Watson 技术可用于解决问题并且推动多个领域的发展。Watson 可以筛选大量数据并返回精确的答案,而且根据答案的可信度进行排列。该技术的应用领域包括医疗领域等,可帮助准确诊断病人,改善在线自助帮助中心,为游客和市民提供有关城市的具体信息,以及及时通过电话提供客户支持等。