DOIT资讯 2月15日国际报道: “深蓝”不败,“沃森”来袭!十五年后,IBM重磅推出超级电脑“沃森”,再次向人类的冠军发出挑战,与肯•詹宁斯和布拉德•鲁特在电视智力竞赛节目《危险边缘》中展开对决。
此前,IBM方面向外界宣布,超级电脑沃森将于下周在美国知名的电视智力竞赛节目《危险边缘》上与两位人类冠军展开对决。此次的人机大战将共分两场比赛,为期三天。沃森在比赛的时候并不需要接入互联网,而是利用多个算法应对竞赛中的挑战。冠军可以获得100万美元的奖金,而亚军也可以获得30万美元的奖金,一旦获奖,IBM计划将全部的奖金都捐给慈善组织。
今天上午8点开始,Watson正在美国比赛现场,挑战两位智力竞赛达人,IBM中国研究院的数位专家:潘越、倪渊、滕晓菲及张雷正在新浪微博上现场解答网友提问,而ID为IBM100的微博帐号正在做文字现场直播。
IBM中国研究院倪渊新浪微博透露,今天的比赛沃森开始一路领先,正确迅速的回答了披头士的歌曲和文学作品角色的两个类别的问题。而在今天比赛第二阶段,“人类选手追了上来。有些问题,沃森知道答案,但是抢答的速度没有人类选手快。“
此后经过一番苦战,三位选手的奖金分别为:Watson 5000美元、Brad now 5000美元 、Ken 2000美元,此前Watson一路领先,但随后有好几题的答案都在可信度阈值之下,因此没有抢答,被人类选手赶了上来。
在微博直播上有看到美国广播公司的视频直播的网友“偶是雨也是R”表示:“刚才看到有道题。沃森和旁边的选手说了一样的答案(都是错的)。也就说沃森不能根据人类选手已经错误的答案筛选自己的答案。”他认为,这可能是Watson设计上的一个小小的缺憾,询问是否能够在随后得到解决,但目前尚未有回复。
———内容持续更新,间隔20-30分钟———
———今日战绩———
今天为期半小时的人机对战比赛已经结束,明天比赛还将继续。本场结局是沃森:5000;Brad Rutter:5000;Ken Jennings:2000。
———详细战况———
据新浪微博帐号IBM100直播显示:第一轮结束时沃森得分还领先, 沃森:5200, Ken Jennings:200, Brad Rutter:400,而在第二轮开始后,Watson开始被人类选手迎头赶上,沃森也开始不断出错,比赛成绩一度为, 沃森:5000;Ken Jennings:2000, Brad Rutter:5000。
此后,沃森最高分达到了6400分,但随着4个抢答问题回答错误,分数被降低到了5000分。
———微问答:———
网友:能否简单介绍这次机器软硬件在哪方面进行了升级,从而能更好适应这种特定字符的搜索?
IBM中国研究院-张雷:DeepBlue开发并使用了一些针对下棋的专用硬件,而这次使用的完全是市场上买得到的基于Power7的通用服务器。90台服务器,每个4个CPU,每个CPU8个核。
网友@Lewind松鼠:就信息的丰度和准确度而言,沃森肯定强于人脑。我觉得对沃森的真正挑战在于能否在无外界帮助的情况下正确理解主持人提出的问题,是吗?
IBM中国研究院-张雷:理解问题是Watson系统的挑战之一。其实,Watson存储的信息也有很多不准确的。所以如何去伪存真也是Watson系统要解决的重要问题。
网友@yzll2010:Watson的技术是不是和WolframAlpha搜索引擎用的技术差不多啊?
IBM中国研究院-张雷:Watson的知识源包括各种书籍、文档、网页和结构化数据,而WolframAlpha自己手工制作了结构化数据。我们推测两者的算法是很不同的。参见Stephen Wolfram的blog:http://sinaurl.cn/hGkYV0
网友@狂牛祭坛:不过到现在仍然深以为:英语是一种崇尚简单的语言,并无很多拐弯抹角。相信沃森用中文参加的时候,会大败无疑。如:中国队大胜美国队,中国队大败美国队,是一个意思。再上点文言文,呃
IBM中国研究院-潘越:中文比英文来讲,语法更为复杂一些,由于语法和词义的多样性造成的歧义非常严重。但国内的高校、研究机构一样,包括IBM中国研究院,很早就从事这方面的研究了。由中文信息学会主办的中文信息处理国际会议就是代表性的一个连续性的关于中文计算处理的国际学术会议,具有很高的学术水准。
网友@偶是雨也是R:刚才看到有道题。沃森和旁边的选手说了一样的答案(都是错的)。也就说沃森不能根据人类选手已经错误的答案筛选自己的答案。这样的问题以后有可能得到解决么?
IBM中国研究院-潘越:你观察的没错,沃森目前没有观察人类选手已给出的答案。如果要解决这一问题需要使用ASR(自动语音识别)技术,目前沃森并不包含这一技术。但IBM也是这一技术的领先者,没有采用是因为统筹考虑的结果。
网友@何山_HeShan:能说一说你们是否在中文方面有过相似的积累,或者说相关的技术是否能够应用到中文的问答系统吗?
IBM中国研究院-潘越:IBM中国研究院和国内其它高校、研究机构一样,很早就从事中文信息处理方面的研究,并研制出了相关的产品和解决方案,如中文知识管理软件包和市场情报门户等,在机器翻译、中文信息的分类、文本摘要、语言搜索等方面有较强的技术力量。
网友@NEO的一片田地:请教,您认为今天比赛后期,Watson频频犯错的原因是?
IBM中国研究院-潘越:原因有很多。其中之一是:沃森收录的信息是不全面的,可能某类多一些,某类少一些;对于较少的信息可能找不到答案,但也有可能找到错误的答案,而且因为信息较少无从判断错误答案的可信度。
网友@崔昊Niky:过多的信息,是否也就意味着过多的答案,虽然信息增多了,但是也会增加沃森犯错的概率?
IBM中国研究院-潘越:是的,怕的是似是而非的答案。沃森采用了根据证据对答案排序的方法。证据来自于相关信息。如果是似是而非的错误的答案,它也会有很多貌似的证据。
IBM中国研究院-张雷:没错。研制Watson中的主要困难之一就是要在大量信息中去伪存真。
网友@e吴凌:过多的信息,是否也就意味着过多的答案,虽然信息增多了,但是也会增加沃森犯错的概率?
IBM中国研究院-潘越:回复@e吴凌: 沃森需要这样,但不仅仅是因为这个。沃森的机器并非世界上最快的,大概还不能排进前100或500。但沃森所采用的DeepQA的技术集成了各种自然语言理解以及相关技术,使得它能够达到与人类同等的水平。
IBM中国研究院-张雷:人脑对问题和答案的判断有着某种直觉。机器只能对所有相关信息和证据逐一处理,如果算得不够快是不行的。
Watson百科:
什么是Watson:据国外媒体透露,IBM Watson 采用的是基于IBM Power7 750 的大规模并行计算系统。Watson 可以运行AIX软件系统,以及linux系统。在2月份,本次参加”Jeopardy”竞赛,将会运行Novell’s SUSE Linux Enterprise Server。
具体配置:Watson 是由 90台 IBM Power 750服务器组成,16T的内存,4T的集群存储。每个Power 750服务器,采用的是4个 Power7 处理器,每个处理器8核。IBM Watson 总共有2880个 Power7 内核。 在系统架构设计上,采用一个有效的平衡技术,可以保证每个芯片的内核分摊计算任务。Power7 一个内核主频 3.55 GHZ,可以保证每秒钟500Gb的带宽吞吐。所以Watson 90台 Power750服务器,共360个CPU,可以每秒钟可以完成180,000 Gb的计算量。
名称来源: “沃森”(Watson)的命名是为了纪念IBM创始人Thomas J. Watson而起的,旨在完成一项艰巨挑战建造一个能与人类回答问题能力匹敌的计算系统,这要求其具有足够的速度、精确度和置信度,并且能使用人类的自然语言回答问题。
竞争力:Watson 模拟“人类选手”参加”Jeopardy”竞赛进行知识问答,并不是依靠Google或者其它的外部系统。而是完全依靠自己的“Deep QA”软件系统,它可以算是一个超级的搜索引擎。这套系统可以完成自然语言的识别和问答。而且现在来看,真的很难“哄骗”Watson,甚至俚语,双关语。这么出色的“Deep QA”系统,是由IBM以及全球范围内的8所知名大学共同研发出来的。
Watson的两位对手:今天与沃森同场比赛的是Jeopardy! 节目最强的两位参赛者: Ken Jennings和Brad Rutter,在 2004-2005 赛季,Ken Jennings 打破了 Jeopardy! 的最长连胜纪录,连续获胜 74 场,共赢得超过 250 万美元;Brad Rutter 是单人 Jeopardy! 参赛者中累计金额最高的参赛者,共赢得 3,255,102 美元。
奖金分配与归属:此次比赛的冠军将获得 100 万美元,亚军获得 300,000 美元,季军获得 200,000 美元。Rutter 和 Jennings 将向慈善机构捐献出他们所获奖金的 50%,而 IBM 将向慈善机构捐献出它所获的全部奖金。