IBM朱辉:大数据是一整套解决方案

  最新数据显示,未来十年内,全球的数据和内容将增加44 倍,其中80%为非结构化数据。对此,IBM中国开发中心信息管理总经理朱辉认为:“任何单一的产品都不能够完整的解决我们现在面临的Big Data的问题和挑战,大数据的问题是需要一整套全面的解决方案来解决的。”

  IBM中国开发中心信息管理总经理朱辉在做关于大数据的演讲

  大数据之“大”

  IBM认为大数据信息有三个特质,被总结为三个“V”:Variety(种类)、Velocity(速度)、Volume(容量)。

  首先是种类,数据往往来自于业务系统,这是主要的数据来源。社交媒体、客户信息、互联网、物联网的产生,越来越多的结构化数据和非结构化数据的产生,大大的扩展了数据的种类。

  其次是速度,企业如何以最快的速度获取这些数据信息。在从数据当中进行挖掘的时候,传统BI的需求能够做到知道,其过去一年、一个季度、一个月做的是什么,但是现在的需求是我需要马上看到大量实时数据的分析结果。根据以前的数据怎么样尽快分析出来下一步可能出现的情况。这对分析速度的要求是完全不一样的。

  第三就是容量,现在数据信息单位已经进入ZB级了,对于企业的信息管理人员,所有的数据信息量都是以几何数据在增长。

  大数据时代的挑战

  所谓的大数据,从本质上主要反映的是现在行业当中的两个现象,一方面随着随着企业业务的推进和演变,企业业务模式正在改变,本身产生的数据越来越多,种类越来越多,数量越来越大,对存储成本、运用成本、查询成本方面的压力越来越大。

  另一方面,IBM对全球大企业领导的调研当中非常清晰的能够看出来,企业的领导者能够获取诸多的信息那,但是并不代表他能够从信息当中得到的参谋价值,或者这种指导价值的正确的。

  朱辉说道:“对于企业CIO来说,由于信息量庞大,CIO只知道你看到了什么,你不知道你没看到什么,有可能没看到的那部分比你看到的那部分要重要,这个时候CIO如何来应付?”

  一些数据也在清晰地体现这些问题,根据调查,1/3的领导不信任现在的数据分析结果,1/2的领导抱怨没有得到自己需要的信息,83%的CIO觉得,BI应该成为他们规划当中的一部分。

  数据反映的问题实质就是:企业CIO对于大数据有需求,他们需要获得一种方法去有效地利用好大数据。

  大数据需要整套解决方案

  许多人在提到大数据的时候会想起Hadoop,但是朱辉认为大数据的挑战不是基于Hadoop这样一款产皮都可以解决的。这需要在Hadoop的基础之上有一整套的解决方案,是一个平台。这个平台当中涵盖了它需要把很多不同的功能模块和产品融合到一起,搭建一个全新的数据架构和平台。在Hadoop、Hbase这些开源软件基础之上,需要与数据仓库、数据库、数据集成、业务流程管理等组件充分集成,得以将大数据融入企业。

  IBM 大数据平台是融合IBM各种产品的一整套解决方案

  另外,朱辉认为在现在这样一个阶段,传统的数据仓库在这当中仍然扮演一个非常重要的角色,至少是海量数据巨大的产生源。而大数据将与传统数据仓库进行有效地互补。