迷失的大数据

迷失的大数据

新的技术概念总是备受热捧,最后导致的结果就是掀起一阵热浪,留下一堆泡沫,“大数据”就是其中的一个。

如果你多接触几个现今的创业者或是企业,只要他们的产品和数据相关,那么会有不少人告诉你他们在采用“大数据”的技术做些事情。但实际上,真正有能力获取足量数据公司的并不多,而且,即使他们有一定量的数据,这些数据也并没有他们所说的那么值钱——除了对基本数据处理能力的要求外,如何清晰和筛选有效数据?如何找到看似没有联系的数据背后的相关性?如何可视化地展现数据结果?如何将这些计算结果与自身的产品和商业模式结合起来?如何实时地将数据模型反映在产品中?……在全局大量数据的采集背后,企业对大数据技术的利用困难重重。

最近,著名的信息技术研究和分析公司Gartner就做了一项有关企业使用大数据的调查,在受访企业中,有64%都已经或计划采用大数据技术,但实际的状况,却不尽人意。

这份报告显示,在2012年,有27%的企业开始从事大数据相关的工作,有31%计划于两年内展开大数据项目。到了2013年,有30%的企业已经引入了大数据,计划参与的企业比例也增至34%。造成这一现象的原因是不少企业都认为大数据能够帮助他们提升用户体验、改进企业效率或是发现新的商业模式或产品。

56%的企业不知道如何中数据中获取价值;41%的企业无法将这项技术与公司战略结合起来;34%的企业缺乏大数据的处理能力;33%的企业难以整合多样的数据资源;29%企业的基础架构遭遇挑战;27%的企业面临隐私和数据安全问题;26%的企业在对大数据项目投资上存在疑惑……甚至还有23%的公司不知大数据究竟为何物?

迷失的大数据

在我看来,企业引用大数据首先得明白——大数据的利用并不是预设方向的数据验证,例如判断人群中A或B选择的倾向性。而是在对巨大体量的数据源进行筛选、做相关性判断、进行处理后,取舍不同维度的数据结论,建立合适的数学模型,同时,不断的在产品上将检验并修正模型。

同时,企业也需要明白,对于不同的行业,大数据的意义也是不同的,例如一些用简单的测试或抽样就能获得较准确结论的行业,盲目使用大数据除了徒增成本、歪曲产品线外,带不来多大的好处。