沃森有希望发展成一整套强大且高利润的服务。
人工智能的历史上有很多革命性的时刻,各种各种理论和技术突破正将类似于人类的智能装入机器之中。
其中最值得提及的包括80年代的“专家系统”,90年代击败人类冠军象棋手的IBM深蓝(Deep Blue)计算机,以及最近能够通过观看YouTube视频学习识别猫的谷歌的人工智能系统。
但要将这些引人眼球的技术变得有实用价值却并不简单。微软联合创始人Paul Allen创立的人工智能实验室的负责人Oren Etzioni说,这些人工智能中的大部分都是为展示特定狭窄领域内的新计算技术而开发的,要将这些技术应用到更宽泛的问题上则面临着严峻得多的挑战。
目前来看,还很少有技术敢宣称能够达到或超过IBM沃森系统的能力,该计算机系统有希望将人工智能推进到普通的商业世界。沃森(Watson)系统得名于打造了现代IBM的首席执行官Thomas Watson Sr。5年前,该系统因在美国的电视问答节目Jeopardy!上击败了两名人类冠军选手而开始广为人知。
但沃森进化成实用的商业工具之路却并不那样平坦。在不断使用沃森来解决了其它计算机无法解决的许多单一问题之后,2014年IBM开始调整自己的策略了。
IBM不再将沃森作为一个单一系统开展业务,而是将其功能分割成了几个不同的组成部分,其中的每一个部分都可以被租用出去以解决特定的商业问题。目前IBM在沃森系统上已经开发了40种不同的产品,其中包括常见的语言识别服务和一些更为雄心勃勃的扩展应用。
尽管IBM目前还没有公布沃森各个组分的性能表现,但该公司表示这一模式已经取得了成效。IBM高级研究副总裁兼负责人John Kelly表示沃森系统已经变成了「我事业生涯中所见过的最大最重要的东西」,而且同时也成为了IBM收入增长最快的新业务。
但批评者说IBM现在挂牌“沃森”销售的服务和当年参加Jeopardy!比赛的沃森根本不是一回事,现在的“沃森”只是一个听起来高大上的品牌,其中的技术其实并没有宣传的那样有革命性。
Etzioni对此评论说:“他们的方式只会适得其反,更负责任的做法是坦率地承认一个系统能做和不能做什么,而不是兜圈子式地炒作。”他还表示,IBM过去5年所做的一切都让人看不出原来的沃森是现在解决现实世界问题的核心技术。
围绕着沃森能力的争论不仅仅是一个学术活动。IBM的传统IT业务正在不断萎缩,客户也随之迁移到了新的云技术上,沃森这时候就在IBM努力证明自己的现代商业服务能力中扮演了极其重要的角色。而这就成为了首席执行官Ginni Rometty在接手IBM四年之后努力扭转公司生存状态的关键。
沃森现在的名气依然和当初在Jeopardy!上的成功息息相关。西北大学计算机科学教授Kris Hammond说:「那是所有人都以为不可能完成的事,它的行为违背了我们对机器的认知,它做了一些我们以为只有人类才能做到的事。」
通过解读措辞含糊的问题并通过其通用知识数据库搜寻答案,沃森展示了理解自然语言的能力,而这正是计算机所需要攻克的最困难的难题之一。这次演示似乎预示着计算机不久之后就能真正“理解”复杂信息并与人类交谈了,甚至还可能继续发展以至于在大部分人类专有领域超越人类。
IBM面临的最大挑战是如何将这一能力应用到比游戏节目更加复杂的信息处理和答案搜索中;对一些客户来说,这可比预想的困难多了!
德克萨斯大学的MD安德森癌症中心从三年前开始训练这一系统以帮助识别病人病症,以便医生做出更好的诊断和治疗方案。
“这并没达到我原来预想的程度,我们还远没到达终点。”德克萨斯大学医疗系统创新领头人Lynda Chin评论说,“这实在非常非常困难。”她说要将玩文字游戏的计算机训练成一位肿瘤学专家和听起来一样几乎不可能。
这个系统的一部分程序是用来消化现实世界的信息的,然而光是读取和理解医生的笔记就给计算机的采集和整理系统构成了严峻的挑战,更何况还有更深层次的认知论问题。Chin说:“在Jeopardy!上,问题总有一个正确的答案”,但在医疗领域,只有根据信息导出的意见。
Kelly否认IBM低估了类似挑战的难度,还表示说目前有很多医疗机构都在准备引进类似的网络诊断系统。
IBM最初的计划是将沃森应用到非常困难的问题中,在早期宣布的“登月”计划中包括“终结癌症”和加速非洲发展这样的社会焦点难题。然而遗憾的是,有关这些项目的报道新闻还墨迹未干,IBM就已然放弃了。比如IBM曾和花旗银行合作探索在各种银行活动中使用沃森系统,但很快这一计划就不了了之。
经过了2014年的调整之后,IBM开始使用“沃森”品牌开展业务。客户可以通过API调用的方式将IBM的服务作用自己的计算组件使用,其中包括情感分析(搜集推文等信息对情绪进行评估)和个性化追踪(使用52种不同的特性测量个人的在线输出并进行判定)。
而在大部分客户的想法里,Kelly说,他们还是有一些雄心勃勃的“登月”计划,并希望有一天能通过全功能的沃森加以解决。但他们的主要动力还是来自于期望短期内改善自己的业务,Kelly认为光是满足这一点就已经意义非凡了。
这种更加务实的态度已经为IBM带来了实际的收益,但却将推迟了真正大问题的解决。澳大利亚能源公司Woodside这样的客户使用沃森的语言能力打造先进的“公司内部知识库”搜索引擎。在将30年积累的20000多份项目文档录入到沃森系统之后,该公司的工程师现在可以用它来学习过去的经验,比如计算特定管道的最大承压。
但人工智能世界的批评意见认为,新的组件化的沃森和原来的沃森技术突破关系不大。Hammond批评说:“感觉就像他们把很多东西都塞进了沃森的品牌下,但这并不是沃森。”
Etzioni也这么认为,他进一步表示IBM在Jeopardy!上的沃森的实际应用开发上一事无成。他说:「没有证据表明IBM可以将狭窄领域内的成功复制到更宽泛的应用领域。」对于沃森品牌下的一众服务,他补充说:「我并不清楚其中一个单一的、非常精彩的应用。」
但对IBM来说,这样的抱怨并不是重点。Kelly说:“任何使用沃森品牌的服务都是非常高端的人工智能、机器学习和高速非结构化数据。”Jeopardy!上的比赛已经过去了五年,沃森系统已经远远超过了当时,并增加了图像识别等新功能,大大加强了其处理现实世界信息的能力。
不过就算沃森辜负当初的承诺,这样的争论其实也没多大关系。如果早期的使用者能够在自己的行业中训练和使用这一系统,那么其能力必然是逐渐扩增的。
Woodside技术和战略主管Shaun Gregory说:“只要它是有效的,你就想率先采用。你就在知识和学习上领先了,机器不会忘记。”
沃森的早期使用者面临的另一个挑战是机器系统所给出的答案究竟有多少可信度。MD安德森癌症中心的Lynda Chin表示,其概率性的处理方法非常类似于人类,经过了专家的训练之后,它会作出类似人类的判断,同样带有偏见。
在商业世界里,只能给出问题的答案却并不能进行解释的智能机器用处不大,Hammond说,“如果你走进CEO的办公室说我们需要关闭三家工厂并且裁员,CEO的第一个问题就是:“为什么”。光是生成一个结果是不够的。”
他补充说IBM还在继续推进系统透明化的尝试,其中包括用户可以使用一款名叫WatsonPaths的可视化工具来简单了解结论生成的机制;但总体而言,这一条路并不平坦。
Kelly说沃森的决策路径完全嵌入在系统内部,它们是非常复杂的。但他补充说:“我们可以倒回去找到沃森为了导出答案而连接的数据点。”
他还将IBM和其它公司的技术进行了对比。谷歌和苹果等公司的人工智能的主要作用是为增强自身的服务或提高广告系统的效率,只有IBM一家在尝试让这一技术对商业世界更加透明,他认为:“我们可能是唯一一家打开黑盒子的公司了。”
即使在沃森经过挫折之后,MD安德森癌症中心仍然相信最好在新技术开始时就使用它。
「我仍然相信其能力可以发展到我们所认为的程度」,Chin说,使用这项技术将全球的肿瘤学专家推理能力交付到其它医生手里本身就已经意义深远了。“和亚马逊用来改进零售和购物一样,它也将改变医疗保健服务。”
Chin补充说沃森不会是唯一一个用来医疗卫生信息化改造的推理引擎,还需要其它技术来补充它。
沃森游戏胜利的5年之后,IBM终于成功启动了商业领域的人工智能革命。现在,它终于要开始实现的诺言了。
在领先的科技公司开发更高效人工智能的竞赛中,还有一个秘密武器:获得大量数据。对IBM来说,因为其希望将沃森打造成商业世界人工智能标准,这可能将成为其一个被低估了的优势;据一些专家介绍,智能机器的核心是通过算法在海量数据中发掘模式并作出推测。机器学习是近来人工智能发展进步的基本技术,它就依赖于通过大量数据对系统进行训练。
西北大学计算机科学教授Kris Hammond说:“现在人工智能领域的新兴技术都涉及到数据。”
而近来人工智能技术的飞速发展也和网络在线数据的膨胀密切相关。比如谷歌就在通过搜集用户丰富的在线行为数据来优化其搜索系统。但IBM的数据体量并不能和谷歌所拥有的数据宝库相媲美,量的缺乏只能希望通过特定行业的细节数据进行弥补。“谷歌只有一种数据——用户情绪数据。我们则有大量(更多样化的)数据。”IBM研究部分负责人John Kelly说。
特定领域的数据越多,其在解决该领域问题上就越智能。随着IBM的客户不断地向沃森输入自己的企业数据并对沃森进行训练,IBM得到的好处也越来越大。
Hammond说,沃森“在许多领域扩增的信息体量”将会成为IBM在人工智能竞赛中最主要的资本之一。
去年,IBM进行了一些收购以扩增其数据储备,其中包括10亿美元买下拥有大量医学图像数据的Merge Healthcare。这些数据现已整合到了沃森健康(Watson Health)之中,而沃森健康也成为了第一个从沃森之中拆分出去的专业业务。
另外IBM还花20亿美元买下了Weather Company公司的数字资产,这些资产将帮助IBM建设更好的有关天气和商业的预测系统,可以实现根据天气预报评估商业风险等功能。
Kelly说:“从我们的客户那里和我们的收购中,我们积累了相当多的数据集。”
当然,要将这些原始数据变成计算的金矿仍然需要真正的技术。但如果能说服客户贡献自己的数据来帮助沃森变得更聪明,那么必将给IBM带来先声夺人的巨大优势,竞争对手再要赶上可就难了。