近日,IBM公司宣布在全球发布针对“大数据”的《分析:大数据在现实世界中的应用》调研白皮书(以下简称白皮书)。白皮书中指出,大数据的主要来源是企业的内部数据。
大数据主要来源于企业内部数据
当前,随着互联网以及技术的快速发展,企业的数据量正在呈几何量增长,以医疗行业数据增长为例,每天需要增长的数据就要达到几十GB,而这仅仅是数据增长的开始,对于金融、政府等行业,数据增长量更大。对于企业CIO来讲,如何让企业的内部数据发挥出更高的价值,显然成为他们关注的焦点,以目前对于大数据的价值处理问题来看,相比于外部数据,CIO更加关心如何把内部数据的价值进行呈现。
白皮书中指出,有超过一半的受访者把内部数据视为“大数据”的主要来源。这表明企业正在采取一种注重实效的方式开展“大数据”工作,也显示出其内部系统中仍有巨大的价值尚未得到开发。
另外,内部数据是CIO所能获得的最成熟、最易于理解的数据。这些数据是通过多年的企业资源规划、主数据管理、商业智能应用和其它相关工作收集整理而来,并经过了整合和标准化。利用分析技术解读这些来自客户交易、业务往来、事件和电子邮件的内部数据能够为组织提供有价值的洞察。
如何做好内部数据
从现状来看, 我们看到面对这些企业内部数据,企业对于这些数据的尝试应用,仅仅是起步阶段,还没有完全发挥它的价值,一方面企业基础数据做得并不规范,另一方面对于能够使企业内部数据价值呈现的产品方案还不是很成熟。 那么,企业内部数据应该如何发展才能够发挥其价值?记者认为,深挖是关键,具体体现以下几个方面:
第一、以基础数据为切入点
目前来看,企业内部数据处理,首先要从基础数据做起。目前来看,国内许多的数据无法价值呈现,很大一部分原因就是基础数据不准确,导致结果有差异,对于CIO来说,首先要把基础的数据做好,从类型、格式以及相关的存储等进行梳理,虽然工作量巨大,但如果没有好的基础处理,显然很难发挥数据的价值。
第二、选择主流高性能的产品解决方案
目前来看,现在服务商推出的产品解决方案,虽然还没有形成一个完整的统一解决方案,但CIO可以选择要呈现的价值点比如针对财务的数据报表,针对基础数据的数据仓库都可以选择最合适的产品解决方案,关键要找准一个点进行切入,然后通过不断的完善,从而发挥出价值。
小结
现在来看,羊毛出在羊身上,大数据的价值还得从企业内部数据中找,(当然并不是外部数据不重要,而是现有的条件还不具备做外部数据的挖掘)但关键要找到方法和技巧,当务之急,记者认为CIO应该先理清思路,站在高端角度来看待数据的价值,只能有了统一的思路才能够把让数据成为黄金成为现实。