当主流媒体选择趋向于我们谈论已久的话题时,我的确很愉快。对于我来说,这很有意义,即使为了吸引大众而简化某些主题。但是,当媒体把它弄错时,我也会很恼火。例如:Dennis Overbye周一为纽约时报所写的一篇有关于大数据看似对人们利益无害的故事。
数据如此之大
在这篇文章中,Overbye断言大数据平行领域之谜会带来忧虑和兴奋。
“Big Data对于我们的了解可能比我们自己了解的更多,但是会有Big Data本身并不知道它实际已经知道的东西么?Big Data在注视着我们,但是谁在注视它呢?”
当Big Data这个词常挂在嘴边时,很容易混淆。以至于我们说Big Data时,弄不清究竟想表达什么意思。
据IBM的人员所说,大数据跨越三个维度:容量,速率和种类。并且可以用来作为找到新兴数据类型和内容见解的契机,可以使你的业务更加灵活并且能够回答你之前考虑不到的问题。
因此,大数据对于我们的了解远远大于我们自己。人类的大脑是极为复杂的,然而它却不能处理我们每时每刻所产生的信息量。科学家告诉Overbye世界银行的数字信息以每秒5万亿比特的速度增长,给他留下了深刻的印象。我承认,5万亿听起来的确很多,但是数据正在以更快的速度和更大的比率增长。考虑下列情况:
·用户每天能发送到Twitter上的信息量会达到2TB(IBM);
·2010年存储了7EB的数据量(IDC);
·仅2011年,创建和复制的数字信息量超过了1800亿千兆字节(IDC)。
数据越来越大
Overbye文章的后面部分提出了一个关于大数据存在的有趣的事情,我们所创建的数据是否会超越我们?我想,虽然它有可能发生,但是大数据的问题并不在于它会被怎样用来对付我们,我们又会怎样看待摆在首位的大数据呢。
Forsyth Communications白皮书有一个贴切的标题“大数据分析,没有太大的数据:引人注目的经济和科技大数据计算(For Big Data Analytics There’s No Such Thing as Too Big: The Compelling Economics and Technology of Big Data Computing)”。
作者是这样写到:
数字领域相关的巨大天文数字使组织接受这一事实,到目前为止为了保持竞争力,他们一直在做传统关系型数据库和企业数据仓库(EWD)。也就是说,如果他们想利用大数据的巨大优势,而避免出现头痛的问题,就要使其转换为真正的商业价值。这意味着将我们周围散乱的非结构化数据转为有序的结构化数据以从中提取价值;海量数据造成的问题所引起的思考对于数据来说是一个契机。
没有人会否认我们已经接触到大数据。并非所有的大数据都良好,所以我们没有坐视不理,而要努力使它变得更好。并且已经有许多人开始这样做了。市场分析师和数据科学家同样能够理解我们的数据所表达的内容,因此我们可以更好的使用它们,对未来的事情做出良好的计划,并且能够更好的管理它们。如果看不到大数据给我们带来的机遇和未来,那么大数据对我们来讲只能意味着毁灭。