“数据”时代的到来,对于每个人和每一个企业都将产生重大的影响。其实早在1980年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,就将大数据热情地赞颂为“第三次浪潮的华彩乐章”。这两年刚刚开始对大数据的热议,虽然现在很多人对 “大数据”还是摸不着头脑,但是大型互联网公司已经注意到了大数据技术的无穷魅力,并运用它们为公司的桶里添金。
互联网公司如何认识大数据
如何正确的认识大数据对于企业来说至关重要,这决定了你会如何利用大数据来创造价值。
来自新浪的童剑认为大数据的有三个特点,一是量很大。象新浪本身这个平台有4、5亿的用户,每天的活跃用户量也有几千万,产生的数据量条目是几十个亿。除此之外,数据的增量非常大,大量活跃用户的分享、评论或转发等都很多。
二是结构的特点。大数据的构成有结构化的数据(传统的数据库)、半结构化的(网页和邮件等)和非结构化的数据(照片、图片、音频或者视频等)。三是数据的处理。数据摆在那儿是没有什么用的,数据要进行加工处理和分析才能产生价值。
搜狐的周林表示,大数据的兴起,也是由以前对确定性数据的分析转为模糊性的,比如你看了十八大的报告,是不是就可以推断你是政治人物,还是你只是关于报告当中的某些内容感兴趣。所以如何从大量的数据中排除干扰点,挖掘到你真正需要的东西,寻找一种可能性的趋势。最重要也不在于你数据的大小,而在于对于现有的数据基础你能找到什么样的规律,把它转变成为商业或用户的价值。
京东商城的李曦说到,他们是从两方面去看待大数据,一是如何快速的获得数据,这涉及到数据的存储和备份策略,二是如何做到快速的即时查询,如何建立数据的建模环境。
乐视网的吴亚洲觉得从人对这个社会的认知方式来说,没有发生过本质性的革命和变化。但是大数据时代,会给我们带来一些新的契机,可以使我们规模化的认识一个人,认识一个社会,认识他的生活方式,对于产业链带来的变化和影响也会非常大。
大数据都带来哪些挑战
大数据带来的挑战是多种多样的,包括存储、安全隐私等方面的挑战,但我们对此不可能止步不前。
新浪童剑认为大数据的挑战确实很多,首先遇到的是存储问题,比如怎么样去构建一个能够大规模扩展且比较稳定的数据存储的平台,能满足各种不同类型的数据的存储。根据不同的业务特点,可能要去构建不同的数据的平台。另外是对于网络技术的挑战,网络硬件的技术也经过不断的发展,开始能够针对大数据的特点做出应对。
最后对于个人的隐私安全保护也是挑战之一,无处不在的用户数据行为分析的机制,使得用户的各种行为完全暴露在互联网上。如果没有保护好用户的数据,可能会对用户的隐私数据造成严重的泄露。
而搜狐周林觉得大数据是一个伪命题,从数据分析的角度来说,互联网从一开始成立就不断的在做数据分析,只不过相对简单一点。而大数据挖掘出来的东西是可以转变为商业价值。而大数据也并不是说需要再单独去做个什么东西,它就是无处不在的,关键是看你如何去利用这些数据,比如我们广告相关的排序,就是基于很大的数据分析而来的。
京东商城李曦表示目前京东已经有几百人在做数据分析相关的工作,最大的挑战来在于他们需要做购物的全流程跟踪,如何做到把各种类型的数据全部整合起来。从用户还没开始下单,到下单以后配送花了多少时间,用户对于售后有没有抱怨。传统的BI手段已经无法做到把结构化和非结构化的数据有机融合起来。而对于解决的答案,我们也是一直在不断的摸索和探讨中。
乐视网吴亚洲认为大数据的挑战是来自人们是否正确的认识了数据的含义,大数据更多的是强调数据的相关性,最基本的问题是你怎么认知它,它是认为的那样吗以及它们之间的关联是什么,除此以外,还有数据的收集、存储和计算。
最后吴亚洲强调到,做的很多数据的分析,在反反复复咀嚼之后,发现开始的结论跟后来的是不一样的。所以,最关键的是,有了数据我们是不是能认真的分析和对待它,发现它真正的价值。
大数据时代用户隐私要受到尊重
用户的隐私问题是大数据时代必然要面临的,如何来保护用户的稳私安全?来自不同公司的嘉宾不约而同的表达了这样一个观点,在了解用户的习惯和行为时,要适时、适度而不过度的为他提供服务。
未来大数据的发展必须要有相相应行业的标准和法规去规范,比如数据交换的标准和规则,隐私相关的安全法规,比如哪些东西在数据交换中是可以被交换的,哪些不能被交换。这些需要产业各方共同努力去推动,使得隐私能被尊重,价值能够共享。