在刚刚结束的互联网大会上,来自缔元信的CEO秦雯与大家分享了《大数据的现实困境》。
此次演讲,秦雯再一次强调了当前大数据热潮之下,许多人、甚至包括一部分业内人士对于大数据的误解。
第一,很多人认为大数据就是数据中心。事实上数据中心是大数据产业的传输层,数据中心是大数据应用的网络基础设施;第二,作为大数据产业的处理层,云计算也时常与大数据混淆。严格来说,云计算是大数据应用的系统基础设施;第三,一部分把数字化信息与大数据搞混,但大数据是数字化信息被生产、消费的过程记录;最后,有很多人误以为海量信息就是大数据,但海量只是大数据的特征之一。相对于海量信息,大数据更具体的指能够反映关系、关联、演化过程等方面的海量信息。
尽管理清了这些误区,大数据在实际运用时,仍面临着业务与数据脱节、内部数据孤岛效应和急功近利追求速效等问题。
同时秦雯指出,数据应用的生态环境也极为严峻。拿公共数据来说,虽然看上去很美,然而却一直停滞在统计数据层面,同时质量也存在问题,数据也存在缺位情况。比如CPI这个数据,我们能够看到的,大部分来自民间组织的统计数据,缺乏专业职能部门规范化的统计。
另外,秦雯也针对大数据应用的技术伦理表示担忧。虚假点击、流氓弹窗、宽带拦截等等现象日趋泛滥。我们技术应用的道德底线究竟在哪里?现在仍未有答案。
在未来,所有的数据都将以“大数据”的方式来采集、以“大数据”做技术处理、以“大数据”的方式创新应用,颠覆传统。但现在,在构建健康的大数据生态上,我们还需要花很多功夫。