随着“大数据”(Big Data)时代的悄然来临,数据的重要性将愈发凸显。未来数据到底有多重要?IBM新任CEO罗睿兰(Ginni Rometty)的观点让人印象深刻。她说,数据将是下一个大的自然资源,将会区分每个行业的胜者与输家。
大数据走红
关于什么是“大数据”,现在还没有标准的定义。维基百科上有人对大数据作了如下描述:数据增长如此之快,以至于难以使用现有的数据库管理工具来驾驭,困难存在于数据的获取,存储,搜索,共享,分析和可视化等方面。
“通俗地说,大数据其实是一种在互联网时代或信息时代的企业现象。”中国软件网、海比研究总经理曹开彬告诉新浪科技,在这样的时代,任何一个企业,尤其是大型企业和互联网企业,会在经营过程中产生大量的、各种各样的数据。它有几个典型特征:数据量大、数据类型复杂、处理速度要快。
所谓数据量大,是指数据不再以几个GB和几个TB为单位来衡量,而是以PB(1000个T)、EB(一百万个T)或ZB(10亿个T)为计量单位;数量类型复杂,是因为它的来源复杂,从结构化数据到非结构化数据;处理速度要快,则是指数据的分析和使用需要在极短的时间内完成,甚至实时使用。
曹开彬说,这导致现有的数据仓库和商业智能等数据处理和分析技术无法应对这种情况,但是企业要对它进行快速处理与分析的需求又很大,因此,大数据才会变得这样火。
资深IT人士谢文对于大数据有另外的看法。在他看来,大数据并不是新概念,而是在物理学,生物学等科学领域早已存在的理论,只不过此前没有有效的手段获取大数据。
他认为,Web2.0时代,大数据应该是以人为核心,以人的关系为基础作信息生产、交换,从而产生的巨大信息爆炸。同时,大数据还将产生比现在更有价值的商业模式。
背后价值
那么,大数据到底能给企业带来什么价值呢?本质上说,大数据本身没有太多价值,基于大数据的处理和分析才能为企业带来的巨大的增值价值。
曹开彬认为,大数据里面包含企业运营的各种信息,如果能对它们进行及时有效充分地整理和分析,才可以很好地、迅速地帮助企业进行业务决策,响应客户需求,提升竞争力。
两个月前,刚刚以大数据概念在纳斯达克上市的美国公司Splunk可以让我们很容易的理解这一点。
Splunk提供一款可运行于各种平台的IT数据、日志分析软件,可以让IT运维人员以类似谷歌搜索关键词的方式,快速搜索并查看任何IT设备运行过程中产生的信息。
一个简单的场景是,当IT设备出现异常时,IT运维人员只需要搜索关键词“Error”,系统便会列出包含“Error”的机器运行日志,并以非常好的图形化方式展现出来。IT运维人员可以据此判断出是异常出现的具体时间,具体设备,并分析故障原因。
显然,与以前凭借经验进行故障判断相比,数据分析提供了更精准的信息,而这便是大数据的魅力所在。那么,企业该如何抓住大数据带来的机遇呢?
Teradata大中华区首席执行官辛儿伦对新浪科技表示,随着大数据时代的到来,企业应该在内部培养三种能力。第一,整合企业数据的能力;第二,探索数据背后价值和制定精确行动纲领的能力;第三,进行精确快速实时行动的能力。
“如果企业在信息治理上培养出这三种能力,对未来大数据时代的驾驭能力会增强,对面临到的挑战会降到最低。”辛儿伦表示。
厂商布局
辛儿伦所在的Teradata公司是一家智能分析解决方案厂商,主要为企业和政府机构做数据整合,分析,探索、挖掘数据背后的价值。最近两年,Teradata通过收购将业务从结构化数据延伸到非结构化、大数据领域。
2011年,Teradata先后收购了云计算软件公司Aprimo及高级分析和管理各种非结构化数据领域的Aster Data公司。今年5月8日,Aprimo收购了基于云的数字营销欧洲领导厂商eCircle,进一步加强并拓展了Teradata大数据市场的业务。
与Teradata一样看好的大数据的还有IBM、甲骨文、惠普、EMC、微软等传统IT厂商,他们也在通过自主研发或者收购的方式进入大数据领域。
IBM在过去五年里,已经斥资超过140亿美元进行了20多笔与数据分析相关的收购交易。甲骨文这家以结构化数据库起家的IT公司,推出了大数据机及智能分析解决方案。
去年8月,惠普以100亿美元收购英国软件公司Autonomy,其实也是为了扩大商业分析软件的市场份额。Autonomy通过独有的算法可以提取出非结构化信息中的含义。
在美国硅谷,Splunk只是大数据领域的一家企业而已,仍有多家创业公司已经聚焦在大数据领域,并且获得风险投资的注资。
国内企业落后
与国外大数据的热火朝天相比,国内企业参与这一领域的并不多。
“国内IT尤其是软件企业在布局大数据方面,已经落后。”曹开彬认为,这主要是国内企业在数据库、数据仓库、商业智能等领域基础薄弱。
不过,他指出,国内企业在这方面仍有机会,但需要找准行业与切入点。
对于国内可能出现大数据公司的领域,曹开彬表示,“我比较看好互联网公司,像百度、阿里巴巴、腾讯,这样的互联网公司比传统的IT和软件公司更有机会。”
实际上,作为中国最大的电子商务公司阿里巴巴已经在利用大数据技术提供具体服务:阿里信用贷款与淘宝数据魔方。
以阿里信用贷款为例,阿里巴巴通过掌握的企业交易数据,借助大数据技术自动分析判定是否给予企业贷款,全程不会出现人工干预。据透露,截至目前阿里巴巴已经放贷300多亿元,坏账率约0.3%左右,大大低于商业银行。
淘宝数据魔方则是淘宝平台上的大数据应用方案。通过这一服务,商家可以了解淘宝平台上的行业宏观情况、自己品牌的市场状况、消费者行为情况等,并可以据此作出经营决策。
不过,谢文并不认为这些是真正的大数据。他表示,未来能够称得上大数据的公司将是Facebook、苹果、谷歌等这样的平台型公司。
他表示,国内没有一家真正朝大数据方向努力的公司。“国内很多公司都在做分拆,并且产品数据也不相通。短期来看,这样可以提高效率,但是长期看,这是反大数据方向的。”
谢文预测,Facebook上市后,下一个伟大的公司应该是大数据方向的公司,并有可能在2020年上市。