全面解析IBM的大数据分析帝国

IBM正在大数据领域取得极大的成功。其IBM大数据网站是一大资源,电视广告也体现了权威性,其产品在该领域确立了牢固的地位。但是在记者看来,近日与IBM商业分析产品和解决方案副总裁 Deepak Advani深入交谈之后,才对IBM的大数据战略有一个全面的认识。

或许久经战场的老手才能做出最好的花样

IBM是一个拥有101年历史的公司,总部位于美国东海岸。该公司生产过打字机,如今仍在制造大型机。其产品使用开源技术进行交互操作,但绝大多数产品需要付费。在其发展史上,很多产品都是通过收购获得的。除此之外,IBM是一家服务公司,在世界的各个地区,都拥有顾问团队。

大数据初创公司大多都拥有一只精简的团队,成立往往只有短短几年,并把总部设在美国西海岸,提供的核心技术往往是在廉价的大众化硬件上运行的开源软件,并在内部建立知识产权。然而,在竞争如此激烈的大数据和分析领域,IBM仍是大数据和分析领域的大玩家。在与Advani的交谈中,使我发现了其中的原因。

收购历史

过去十年里,IBM在商业分析领域进行了大量的收购。最让人印象深刻的例子就是,IBM在2007年收购了商业智能领域的重量级公司Cognos——而同年早些时候它刚刚收购了Applix。这笔交易让IBM拥有了一款端到端商业智能套件,包括传统的和内存中的联机分析处理 (OLAP)、报表、仪表板和数据可视化。这也是我所知道的。

但是我不知道IBM的其他一些收购案,而它们带来的整合分析价值其实是所有收购案的共同成果。在收购Cognos之前,IBM还在2005年收购了Ascential软件公司,为IBM带来了提取取、转换和加载(ETL)的数据集成工具DataStage及其他资产。而在收购Cognos之后,IBM在2009 年吞并了重量级统计分析软件公司SPSS,并在2010年并购了大规模并行处理(MPP)数据仓库厂商Netezza。

除了完整的商业智能套件外,IBM还拥有用来支撑商业智能系统输入数据的高性能数据仓库技术,以及对输出结果执行预测分析所必需的工具。说到分析,这是一个与风险管理密切相关的话题。考虑到这一点,IBM在2010年收购了OpenPages并在2011年收购了Algorithmics公司,只为更多地引入大数据。

上面提到的只是IBM在商业分析领域的部分产品。实际上,IBM拥有诸多产品,正如Advani介绍的,IBM有一整套完整的“Signature Solutions”计划,旨在强调IBM在该领域中更值得关注的产品组合,以及由其服务部门围绕这些产品开发的知识产权。

既有自主开发产品,也有从外面收购的产品

当外部的开源技术与它自己的一些产品相竞争时,IBM能够与这些开源技术协同运行吗?当然能。IBM可与R(SPSS的竞争对手) 协同运行;它与Cloudera(其Hadoop发行版与IBM自己的同样采用开源技术的Hadoop发行版相竞争)有合作伙伴关系,并且可以使用Mahout,而Mahout是在Hadoop上运行的机器学习组件。当然,另外还有Linux,多年来IBM一直在战略性地使用这款开源操作系统。

在分析领域,IBM也拥有许多自主开发的产品。InfoSphere Streams和InfoSphere BigInsights就是两个例子,前者是一款复杂事件处理(CEP)解决方案,而后者是IBM自己的Hadoop发行版。BigInsights Hadoop发行版方面值得关注的一点是,它与IBM的DB2关系数据库管理系统集成,DB2数据库管理系统是业界最重要的数据库管理系统之一。虽然关系型数据也许不是大数据,但是之前取得的成就为之后获得成功奠定了基础。知道如何实际处理数据为以后分析数据建立了平台和能力。

关于硬件也是如此。IBM几乎等同于大型机电脑和在这之上运行的后台系统,几十年来一直在收集数据。用这些工作负载来处理系统,很长时间以来,使得大数据成为IBM的一个具体的概念。它不只是构建产品和要求其客户想象各种通过它们运行的数据。想象是好的,但是几十年的经验使得想象并不是很有必要。

关注产品的同时,也关注人

由于在数据分析领域拥有如此庞大的产品系列,这就导致很容易忘了人力资本。但是人的因素在IBM的大数据战略中的角色比产品还要重要。首先,IBM拥有强大的科研团队,据Advani透露,IBM在私有行业中最庞大的数学运算部门。这显然为IBM在预测分析领域提供了强大的能力。

另外一点,就是IBM早在2002年就收购了普华永道会计师事务所的咨询部门。甚至早在这笔交易之前,IBM就拥有一个举足轻重的全球服务部门,但是收购普华永远咨询部门大概使阿蒙克(IBM总部所在地)由一家设有服务部门的产品公司,变成了充分利用其母公司一大批自有产品的服务公司。

Advani提及了IBM的另一个分析项目,分析决策管理,该项目致力于把分析功能嵌入到商业应用软件中,而不是迫使一线员工深入到专用、孤立的分析应用软件,来分析及获取那些宝贵信息。举例说,这个项目让呼叫中心的员工得以了解推销什么样的产品适合某些来电客户;推销出去后,结果可能会是怎样。这些应用软件的用户甚至没察觉到自己在运用分析技术,因为它嵌入到了操作工作流程中。很显然,IBM结合自己在科研和服务交付方面的经验加强了在这类一线员工场景下满足需求的能力。

与Advani的对话确实让我们大开眼界。多年来,我们一直在关注IBM制造产品、收购公司;我们明白它热衷于大数据和分析领域。但是在头脑里根本没把这一切串联起来。IBM处于独特的位置,正在大数据领域做竞争对手做不了的事情。

蓝色巨人不好当

其他技术公司、尤其是新兴公司希望怎样打造一个类似的数据分析帝国?IBM又将如何管理这么多的产品、技术、咨询团队和收购过来的公司?毕竟,庞大帝国大多数最终渐渐走向衰落。

在发布新版本产品的同时,IBM需要把其产品系列整合起来。在商业智能方面,我已看到这一幕开始出现,IBM需要再接再厉。与此同时,小规模的新兴公司不用操心管理如此多的不同组件;说到开辟和推动创新技术以及围绕这些技术的市场,这些新兴公司必不可少。大数据就是这方面的一个例证。

最终,这个行业需要整合。大数据领域会日趋成熟,更多的企业级软件公司会进入该领域,它们会收购一些新兴公司,整合就会随之出现。新兴公司让我们看到了理想主义、开拓新领地的重要性;而IBM的状况让我们看到了把大数据与企业级软件和主流服务组织相连接的重要性。它还表明了把分析功能嵌入到让人觉得看似普通的业务软件带来的显著优点。

创新至关重要,但是只有整合到主流的工具、产品和公司当中,它的价值才会充分体现出来?