认知计算时代,IBM的新布局

Tom Rosamilia,IBM高级副总裁、系统部总经理,主管IBM中间件、服务器和存储的全球业务以及全球业务合作伙伴部门。Tom Rosamilia ,1983年入职IBM蓝色巨人高管,曾经带领团队剥离了x86服务器和半导体制造业务,一手将Open POWER带入IBM新的转型过程当中。

801681787547161033
Tom Rosamilia IBM高级副总裁系统部总经理

Tom Rosamilia颇具有传奇性的背景经历,备受新闻媒体的关注。12月7日,一个阳光明媚的冬日,在IBM中国公司办公室,Tom Rosamilia接受了DOIT传媒存储在线总编宋家雨的独家专访。

OpenPower完胜x86 ?

认知计算需要有深度学习、机器学习的能力,还要有非常先进的分析能力,这需要很强大的基础架构支持。即使在云计算业务应用领域,Power处理器+GPU+NVLink的整体能力完胜x86。腾讯夺得Sort Benchmark全球排序竞赛冠军,就是最好的注解。

宋家雨:第一个问题,这也是一个比较老的问题,相信很多人都问过您了。现在IBM将自己定位成一家云计算和认知商业公司,我想问您系统部在IBM认知和计算中扮演怎样一个角色?

Tom Rosamilia:这是一个非常好的问题,IBM正在转型,向一家搭建在云上的认知商业企业转型,而且我们能够根据不同行业的特定需求,提供特定的认知能力。在这样一个大的转型过程中,每一个业务部门都会起到非常重要的作用。

当IBM提出认知商业战略的时候,其实谈的是认知时代的到来,是对全行业而言,而不只是对IBM一家公司而言。认知计算需要很强大的基础架构的支持,比如说需要有深度学习、机器学习的能力,还要有非常先进的分析能力等。

所以,我们必须要交付足够的基础设施、基础架构,来支撑认知计算。举个例子来说,IBM Power Systems不仅仅停留在处理器层面,而是交付一整套的系统,这一整套系统中的每一个组件都是为了服务认知计算。认知计算要求整个系统能够进行深度学习。所以您可以看到,我们这个部门的整体战略是,我们不止提供高级的I/O,我们还给系统配置了加速器,比如说GPU、FPGA/ASIC等,还在处理器与加速器之间实现高速互联,这些能力都是要进行具备的。这一整套系统能够满足不管是AI,还是认知的需求。

我知道您在技术上非常擅长,所以我们不妨从技术的角度深入分析一下这个问题。当我们谈机器学习的时候,机器学习通过处理器和GPU组合进行加速,我们和我们的合作伙伴NVIDIA,最优秀的GPU厂商进行合作,把他们的GPU和我们的Power8,通过NVIDIA的专利技术NVLink进行互通互联,生成一套最优的系统进行机器学习。

但如果您已经获得了大量的数据,现在要把数据进行模式的匹配,在这个模式匹配阶段,您不止是需要一个Power8,其实更多的是需要一套完整的系统,比如Power8和Xilinx FPGA结合在一起。IBM和NVIDIA一起合作,在全球签下了很多大单,尤其是在高性能计算领域。

我看到行业有这样一个融合趋势,HPC、HPDA,以及AI都结合在一起。我们很多的客户都是在超大规模数据中心里边加入了AI和认知的能力,他们做到了这点,从基础设施层面把Power8和NVIDIA的GPU结合在一起,Google用的是Power9+NVIDIA GPU。

这里就谈到您问题的第二个部分,我们企业通过云实现交付,随着IDC被广泛接受,我们也看到更多的机会,因为现在有44%的能力要通过IDC的提供商来提供,那这些提供商就包括IBM和您知道的BAT、Google、微软、亚马逊等等,您看到云上提供的已经不止是基础性能力,还有很多很高级的能力,这就要基础设施层面也要能够实现这一点。那您看到我们的客户可能需要交付私有云的客户,可能需要混合云交付,有需要高性能计算能力的客户,还是为有大规模数据中心提供公有云服务的客户,他们都需要非常强大的基础架构支持。而我们恰恰满足了他们的需求。

希望我们用Power做例子已经向您证明了,在认知和云时代, Power支持的基础架构起到什么样的作用。

宋家雨:认知计算也好,云计算也好,用户不只有Power Systems这样的选择,也有另外的选择,比如基于x86这样的选择。我想问的问题是:跟x86相比,您觉得Power系统最大优势是什么?

Tom Rosamilia:Power Systems在认知负载领域具有很强的竞争优势,因为它集成了强大的加速功能。它每一个核能够处理的线程数量是非常强大的,无论是NVLink 还是CAPI架构,我们都是把GPU和Power结合在一起,所以你可以看到Power的处理器+加速器+NVLink的整体能力都完胜x86。

单从处理器的表现来看,我举一个例子,腾讯公司最近夺得Sort Benchmark全球排序竞赛的冠军,在比赛中腾讯云完成100TB的数据排序的速度是最快的,用时不到99秒(98.8秒),将去年的最好成绩纪录329秒提升3.3倍,而这就是在Power8的架构上来进行运行的。更有趣的一点,Open Power架构服务器是根据腾讯的需求定制,所以在整个过程中,OpenPOWER起到了非常重要的作用。

宋家雨:既然说到腾讯的排序大赛,我想问您,这次获胜意味着什么,您觉得会意味着Open Power将来在云计算领域里更多替代以以往x86服务器的应用吗?

Tom Rosamilia:总体来说,不管是云还是本地交付上, Power都有很强的优势,比如I/O、线程处理能力很强大,以及纯粹性能上都很强大。Power分析能力非常强,不管是传统的关系性数据库,还是现在的一些新型数据库,像MariaDB、MongoDB之类的,Power的处理能力都要远远强大于x86。

而下一代数据库,就把GPU或者加速器就加进去了,比如说Kinetica数据库,他的这个数据库,里边除了有处理器之外,还加了GPU,所以比x86的表现要好很多。即使其实没有加速器, Power8的表现也是很强大,比如说Power8支持的SAP HANA在运行的时候的虚拟化能力,以及内存的存储量,还有性能都远远强于x86。

在这些所有的例子中,您可以看到,其实Power对于环境没有要求,不管是在专属环境还是在云上,Power都能够交付更高的性能给用户。腾讯此次排序大赛赢得很大的胜利,表明我们在OpenPOWER开源社区的发展已经有了新的进步。还有其他的一些客户也给我们做了一些佐证,比如说谷歌把Power9用到了他的X-base项目当中,还有,在欧美的高性能计算的领域很多企业也选择来使用我们的Power,所以,现在不管是超大规模数据中心,还是高性能计算,已经有越来越多的企业加入到OpenPOWER的环境当中,而且我们现在提到OpenPOWER越来越强大不单是他的会员数量越来越多,还有很重要的一点,他的销售量还在大幅度的增加,所以不管是和腾讯进行合作,还是和其他的高性能计算、大规模数据中心的企业进行合作,我们还要重视实实在在的销售。

那些选择了x86的用户,他们错了吗?

客户从惠普、联想、华为、思科、戴尔等品牌中进行选择,其实质其实是从一家企业购买,那就是从英特尔购买x86,基于此,IBM需要给用户提供更多的选择。在自主创新战略的指导下,中国企业需要更多的技术创新和本土设计的能力,而这些都需要有更多的选择。

宋家雨:在HANA这样的应用里,很多人会选用x86这样的一个环境,很重要的一个原因是,大家认为x86在价格上会比较便宜。在这个方面,您怎么看?

Tom Rosamilia:我非常理解,我也是非常看中性价比的。如果仅仅是性能好,那么不可能赢得市场,一定是性价比高才能赢得市场。现在我们在全球已经赢得了300多SAP HANA的大单,这些大单就说明,因为我们能交付更好的性价比,所以他们会选择我们。

如果我们再往前看一下的话,其实从SAP开始在Power上运行的时候,到现在我们已经赢得了6000多个客户。这6000多个客户之所以选择在Power上运行SAP,就是因为和x86比起来,他们看到了更高的性价比。所以总结来说,客户的选择很多,如果我们不能够提供高的性价比的话,那么我们不可能获得胜利。

宋家雨:对于那些选择了x86的用户,您想跟他们说一句话吗?比如说:他们的选择错误了?

Tom Rosamilia:我想告诉他们,要根据他们的工作负载来选择合适的配置,举一个例子,上周我拜访了一家服务器的提供商,这家厂商在中国做的非常成功,有提供20多款不同配置的服务器,其中大部分是x86的,也有一些是基于Power的。他们的成功,是因为他其实是根据不同的工作负载来对服务器进行配置,有的就是密度很高的服务器,有的就是小型服务器,但是I/O特别强大,还有的是里面配置了GPU。其实他会去考虑,对他的用户来说,完成特定的工作负载如何对服务器的配置进行优化,如果这个优化对他来说性价比是非常合适的,那么用户是会被打动的。

我想要强调一点,在当今世界,竞争对于技术的发展是非常有好处的。客户如果只是从惠普、联想、华为、思科、戴尔等品牌中进行选择的话,其实他们只是从一家企业在进行购买,那就是从英特尔购买x86。所以,如果想打破英特尔公司的垄断的话,我们需要给用户提供更多的选择。如果真正实现在中国,为中国,由中国企业来生产自己的服务器产品的话,那么OpenPOWER是非常开放的,它是提供授权的。而英特尔公司是不提供授权的。

全球之所以都欢迎其他的选择,是因为欢迎竞争。在自主创新战略的指导下,中国企业需要更多的技术创新和本土设计的能力,而这些都需要有更多的选择。

宋家雨:IBM系统部排前三位的业务是哪些?

Tom Rosamilia: IBM系统部里面有三大品牌,存储、主机、Power服务器,每个都很重要,我都很爱。先从主机说起,主机是IBM对我们的客户、合作伙伴来说,是未来发展战略所在,所以具有很重要的意义和地位;Power服务器为我们在全球对抗x86的垄断提供了一个非常好的机会。现在OpenPOWER的生态系统已经建立起来,并日益壮大。对存储来说有两大战略重点,一个叫做软件定义存储,一个叫做闪存,所以你要问我具体的排序的话,我会说主机、OpenPOWER、软件定义的存储和闪存。

剥离了System X,绝对不后悔

卖掉System X的业务对我们来说一点遗憾都没有,事实上还是一个非常愉快的选择。在超融合方面,我们在和思科进行合作。

宋家雨:现在我们回头看, IBM以前剥离了System X的业务,这样的选择是不是一个不太明智的选择?

Tom Rosamilia:卖掉System X的业务对我们来说一点遗憾都没有,事实上却还是一个非常愉快的选择。因为像交付这种超级规模和完全商品化的产品,并不是IBM所擅长的。像联想这样的企业会更擅长一些。

令人高兴的是,在超融合方面,我们在和思科进行合作。思科把我们的存储加上他们的一些基于x86的服务器结合在了一起,推出了UCS的服务器。所以,IBM的存储在实现超级融合的过程中起到了非常大的作用。这个合作伙伴项目也是由我主导的。

宋家雨:如果没有x86服务器的话,是不是会削弱你们在软件定义这方面的优势?

Tom Rosamilia:我倒真不这么看,因为我们觉得对于软件定义环境来说,最重要的是软件,他是我们的秘密武器,而不是下层的那些通用的商用化的影片设备。所以我们的软件定义存储是可以在任何硬件上运行的。

宋家雨:从Power到OpenPOWER,是否像Soaris走向OpenSolaris一样,走向开放的时间是不是过于晚了?会不会重蹈Solaris到OpenSolaris的覆辙?

Tom Rosamilia:OpenPOWER现在已经走过了三年,相比之下,OpenSolaris从来没有获得过太大的成功。我个人非常喜欢Solaris,我觉得他是一个特别好的操作系统,而且对大部分人来说,他们之所以使用SUN的硬件,很大原因是因为他们喜欢用Solaris操作系统。IBM和SUN的理念和做法很不相同。SUN并未对OpenSolaris开源项目里的成员投入,但是对于IBM来说,是不一样的,我们的OpenPOWER现在已经有270多个会员,而且这些会员在硬件、软件,尤其是硬件层面,对于OpenPOWER进行了大量的新的能力的注入。

OpenPOWER现在已经有了270多位成员,而且我们现在提供的是在Power上运行Linux。对于x86的架构,我们也提供兼容支持。同时我们还在开源社区了提供了大量的知识库,这样的话,使得OpenPOWER的平台变的更加丰富,同时我们还提供了加速计算的能力。SUN没有做这些投入。而且在Power的硬件这个层面,我们还愿意进行公开的授权,这个也是SUN从来没有做过的。

宋家雨:我想请Tom分析一下,未来Power和OpenPOWER的市场定位和格局。

Tom Rosamilia:我们致力于提供最优的服务,为认知、人工智能、机器学习、加速计算提供支持。我们把我们自己定义成“认知的引擎”。

Watson如何加速落地

Watson和谷歌AlphaGo不太一样,AlphaGo虽然也是具有很强大能力,但它其实针对特定的场景推演,与之相比,Watson面对是更加无法预知的计算,这两者之间有很大差别。问答只是Watson具备的众多能力之一。Watson也在进一步的发展,他的众多能力已经被转化成API,可以被重新包装成为一种服务,应用到行业实践场景当中去。

宋家雨:在认知计算这方面,很多人觉得Watson和谷歌的AlphaGo享有一样的美誉,但是就像AlphaGo一样,我们不知道谷歌AlphaGo未来会在我们的实际应用中,在哪些地方事先取得突破。那么,关于Watson,其实我们有同样的问题,Watson和你们在医疗行业有这样的一个合作,除了医疗行业以外,会不会选择一些其他的行业,把Watson这样的一个技术,跟实际应用尽快的落地?

Tom Rosamilia:我们现在不妨从Watson的历史来看,我们最开始研发Watson的时候,是开发了一个大块头的应用,这个应用就是为了能够回答问题,并在2011年参加“Jeopardy!”电视问答挑战赛。而且在进行这个应用设计的时候,因为问题是完全开放式的,我们完全没有办法确定到底哪些问题会被问出来。这就和谷歌的AlphaGo不太一样,AlphaGo虽然也是具有很强大的能力,但是他其实针对的其实就是游戏或者是下棋的步骤,这些棋的每一步都是基本能够进行预设。所以如果说AlphaGo进行的计算都是有限的话,Watson的计算是无限的,这是两者之间很大的差别。

问答只是Watson具备的众多能力之一。Watson也在进一步的发展,他的众多能力已经被转化成API,转化为一套服务,这套服务能够提供情景分析,自然语言处理,以及转化成各种服务的能力,所以对Watson来说,他可以被重新包装成为一种服务用到客户的特定的场景当中去。

确实,在医疗方面,Watson已经有很多的用户案例。另外一个例子就是沃森现在被用于用户呼叫中心,有的是叫Watson单独来回答用户的问题,有的是要呼叫中心的工作人员和Watson在一起,让Watson来帮助工作人员回答一些很难回答的问题。

在零售行业,Watson也在发力,现在Watson能够帮助商户来进行更好的用户图形描绘,这样就能更好的引导用户,让一些只是从网上的浏览潜在的买家,,变成真正最后下单交易的买家。

而且在金融服务行业,Watson也在发力,比如说他能够帮助金融行业的从业人员,基金经理之类的分析他们用户的产品组合;基于用户的风险评估能力,以及用户对于投资回报的期待值,向用户提出他的产品组合,以及对于到底是怎么样进行组合的给出一些建议。

我们有一个PaaS平台,Bluemix,Watson也在这个平台上运行,可以说,Watson是这个平台上最受欢迎的应用。

现在我们基于Watson提供一些服务,当然我们也欢迎其他的企业来基于Watson提供服务,这样的话就建立起一个围绕着Watson的开放式的生态系统和这样一个平台,企业可以在这个基础之上加入进来,可以把他自己的新的能力商品化。这样的话,在这个平台上也许能够解答全世界面临的更大的一些问题。我们是基于50个Watson的API去做服务,所以任何公司跟我们合作都可以去调用那个API。