IBM大数据:行胜于言的必要性

DOIT软件 6月4日原创报道:如果有了大数据,我今天的倒霉的快递体验或许可以被改变?

大致情况是这样的:我在淘宝上定了一些装饰和照明灯,一共发货了9个箱子,但快递员却以“货还没到齐”为由第一次只给了我其中的8个,最后一个箱子却陷入了:‘我必须按照快递员上下班、休息日及顺道时间(为准)才能够收货’的怪圈,而我到现在也不知道那一个箱子在哪里,快递员又‘何时方便给我送’,在我与快递公司、卖家、快递员一圈周旋之后,我可能不得不做好放弃最后一个箱子的准备了。(好吧,我会告诉你这家快递公司叫宅急送么?)

中午,打完投诉电话之后,我坐在IBM 2013大数据分析峰会的现场,突然想到,如果有了大数据,我今天倒霉的快递体验或许可以被改变,至少,我不会被快递搞得一点儿脾气都没有。

我之所以这样想,是因为在越来越多的行业,我们越来越多的发现大数据所带来的行业变革与全新体验。以物流行业为例,虽然目前我们已经能够在淘宝或是快递网站上看到货物的流转信息,但是我们却无法以实时的方式获知,我们也无法获得快递员的位置、快递员的路线规划,我们当然也无法获得快递公司大致到达收货人所在位置相对准确的时间点,而当我们的投诉制度还停留在打不通的400或800电话时——既然可以通过声音来打车——为什么没有接受留言、留影投诉的系统呢?

更进一步,如果我们能够通过历史经验、环境数据、快递公司(快递员)的工作安排,预估货物到达时间,或是协调一个更方便、合适的时间,不仅是对收货人极为有利的事情,对快递公司来说,显然也是一个不错的提高客户服务及优化快递递送时间的举措吧?说实际点儿,快递员不是也就挣得更多么?

而IBM全球副总裁大中华区软件集团总经理胡世忠的“行胜于言”也就因此而打动了我。

大数据的话题被业界热炒已经不少时日了,几乎就要成为一个被过度消费的话题,但所幸,大数据这个话题实在是“宰相肚里能撑船”,其容纳IT行业、信息技术、物联网、社会发展及个人生活的能力远远超过云计算——这个话题太大也太有宽度了,所以,你甚至可以一直聊下去,聊个三天三夜昏天黑地。

这并不是对大数据话题的贬义,是的,这里有不小的泡沫,但这也恰恰说明大数据是一个与社会、行业、科技发展密切相关的话题,它实在是太入微、入细了,所以,胡世忠所说的“行胜于言”就变得尤为重要。

除此以外,在我亲身经历并“思考”了快递业的大数据潜力之后,我对胡世忠“大数据才仅仅是开始”的看法也表示赞同,正如他所说,大数据要真正发酵并实现“在数据中获取新的竞争优势”以及“以数据成为重要的资源”,可能还需要几年——胡世忠的答案是2015,而我觉得时间可能会更长,但值得等待。

在IBM 2013大数据与分析高峰论坛的会场,胡世忠勾画了一个“企业大数据规律”,他认为,大数据会成为“一个全新的经济定律,数据成为自然资源”,而“企业要想从大量的信息中创造价值和获取竞争优势”,其必须做到三点:1、取得更多的信息;2、获得更多洞察力;3、将洞察力迅速付诸行动,进行创新变革。

这一点上我和胡世忠的观点稍有不同,由于按照一些国家、行业法律、规定,许多企业都有长期积累的数据资产,而这些资产实际上就是堆在那里无人问津的金山,为什么企业不先去着手去处理那些旧的资产?为什么他们不去“翻翻故纸堆”呢?

在很大程度上,导致如此结果的原因来自于业界对于大数据一个错误的态度,那就是“大数据是新的”,换句话说,“大数据需要Hadoop这样新的方式方法才能解决问题,所以大数据是个新鲜事物”——这实在是极大的谬误。

即便是在胡世忠所谈到的四点“将企业整合进入已经因为数据而改变的世界”的观点中,也只有社交网络和移动工具算是一件新鲜事:

1. 把管理整个企业的不同数据作为一个核心竞争力

2. 规范和简化操作使企业变得更加灵活

3. 采用社交和移动工具提高生产力

4. 建立开放的文化去共享信息和协作

其实从IBM的策略上我们也就能够发现一二,在这次大会上,除了发布的大数据分析加速技术BLU Acceleration以及面向Hadoop的PureData版本,IBM大数据平台的旗舰产品BigInsights、Streams、DB2、Informix等无一例外是增强了功能的新升级版本,即便是BLU Acceleration,实际上其也是面向“现有的数据平台”的产品。

事实上,BLU Acceleration延续了传统的内存管理系统的功能,通过整合改善分析能力和简化管理的一系列技术,能够帮助用户更快速地抓取关键信息,并将数据分析速度提高,它的基础或者说与其紧密相连发挥作用的,是集成了BLU技术的新版DB2 10.5,而不是Greenplum或是Hadoop,而作为客户案例宣讲的“北美地区最大的货运铁路运输公司之一BNSF铁路公司案例”,也能够充分说明这一点:在这样一家代表了保守、传统与稳定之上的铁路运输公司中,DB2显然是延续了多年的产品,而也正是这些有着极深积累的企业,愿意在以积累平台为基础,实现与“大数据热潮”一样的效果。

另一个与我的观点一致的产品就是“新版本企业级Hadoop产品InfoSphere BigInsights”和“流计算软件InfoSphere Streams”,前者是一个帮助企业快速开发应用组件的产品,但是重点是“利用现有的SQL技术”;后者是一个增强实时分析的开发和部署的工具——当然,他们都是以InfoSphere为基础的。

除此以外,新版关系数据库管理软件Informix包含TimeSeries Acceleration,能够适用于智能仪表和传感器数据的运行报告和分析——Informix?是的,你没看错,IBM将Informix也拉到了大数据的战斗之中,这当然是在正常不过的事情,除了DB2,IBM在数据库上另一个强有力的产品就是长盛不衰在许多企业仍然担当大用的Informix,就像甲骨文除了Oracle数据,还有MySQL。

这是为什么?好吧,如果你没有用小沈阳的语调说出来,我想我还是可以尝试回答下你的问题:

1、 大数据并不只是大的非结构化数据:结构化数据是绝大多数核心资产,而对这些资产的保护、使用可能做得很好,但分析、再造数据价值在很多企业实际上是个从零起步的事情。

2、 不一定是Hadoop才能大数据:大数据的4V中,数量来自于积累、速度来自于平台、多样性是数据本身的特性,而真实性,或者说是准确率,实际上有赖于工具,只要有工具、平台提供了高准确率的信息分析平台,甚至只是在原有平台上的加速,为什么不是大数据的良好利用方式呢?

3、 改造远比重建容易:基于以上两点,在旧平台上做创新,在已经稳定、牢固运行的系统上发挥数据价值,难道不是最省钱也是最熟悉的事情么?为什么一定要重头再来?

或许,胡世忠“行胜于言”的另外一层意思是:如果你以现有的企业信息化平台为基础,做出行动可能会更加简单和容易,而不会在用嘴说一说大数据的阶段原地踏步。