提防打着大数据的幌子搞“算命”

大数据这个词在世界杯狂潮来临后进入了一个新的高潮,德国队运用大数据分析提升球员能力、调整战略部署最终夺冠消息一传开,业内更是欢欣鼓舞,仿佛以后的“预测业”将大展宏图。

然而,在百度、谷歌等等科技企业大肆鼓吹大数据分析准确科学的同时,笔者仿佛看到了当年保险业务员向自己推销保险的场景。他们总是罗列出当前业务的种种好处,各种高收益回报让人怦然心动。但是当笔者要求看看合同的时候,他们却又说只有签合同的时候才能看。后来旁敲侧击才终于套出保险员的一点点实话,比如他们为你承诺的高收益有时间要求,很多都是要十几年甚至二十几年后才能取出的,如果你中途要取出,那么收益可能跟银行定期差不多。而他所承诺的各种意外后保障,其实都有普通人没注意到的限制和语言的游戏。模棱两可之间,其实是把那些权益都收了回去。想得便宜的投资者一旦糊里糊涂签了,其实最终的回报可能也就比银行定期多一点,根本未达到投资的目的。

这就好比是告诉你风险投资的种种好处,却不告诉你一旦遇到问题你会输得一塌糊涂。避重就轻的伎俩,是现在国内很多不规范的保险、基金、金融投资的惯用手法。

现在,这种手法似乎也用到了大数据分析当中。就像是巴西与德国的那场比赛,谷歌计算出巴西69%的胜率。在比赛未进行时,大家都以为巴西赢定了。然而结果,却狠狠破了一盆冷水。没错,大数据预测者们在事件结果未出之前,总会强调自己过去准确预测的那些成绩,然后鼓吹自己此次计算结果也是准确无误的。

其实,笔者并不能证明这个69%的胜率到底是对是错。但是一个很浅显的道理:10支签里7支红,也未必就一定能抽中红色。

所以谷歌自信满满的时候,却得到了当头一棒。

当然,某一些做大数据预测的科技公司出发点并不是去欺骗使用者,他们计算出的也是趋势和概率,只是他们自己也陷入了那些冰冷数据取得的成就之中,忘记了31%的失败几率。

事实上,正是因为这些科技巨头被击碎的自负让笔者担心:会不会有一些小的数据公司,他们并不具备大数据分析的能力,或者他们只具备初级的数据分析能力,由于看到了“大数据”的热潮,于是跟着标榜自己是“大数据分析”,以此来捞上一把?甚至很可能出现根本不懂大数据分析的人,打着大数据的旗号,吹嘘自己的分析“科学”、“准确”,误导和欺骗普通使用者!

事实上不仅在中国,即使在大数据分析较为成熟的欧美国家,也有人会陷入大数据带来的辉煌中无法自拔。仿佛有了大数据,一切都迎刃而解。拍电影不是问题、竞技比赛不是问题,甚至连未来也不是问题。最终一部部电影像是同一个模子卡出来的,比赛失去了激情只剩对分析数据的机械实现,而未来……谁又知道呢?

我绝不会否定大数据优秀的指导作用,因为日耳曼战车横扫南美成为四星德国,证明了正确运用大数据分析,团队将收获丰硕的果实。从德意志身上我懂得了:大数据怎么用,才是我们最需要正视的问题。

大数据预测本身并没有错,但是若是变成大数据“算命”,那就本末倒置了。

依稀还记得电脑兴起阶段,在游乐园里见过一台“算命机器”,标榜自己是“科学算命”。当时就感到很好笑。可是现在大数据分析,是不是就要变成那台“算命机器”了呢……