关注:用扎克伯格定律再谈大数据时代

不到一年前,Facebook创始人扎克伯格在Web2.0峰会上宣布,根据Facebook统计数据,社交分享信息量以倍数增长,今天分享信息总量比两年前增加了两倍,从现在开始后的一年,用户所产生的信息分享总量将会翻番。扎克伯格的社交分享定律可以用一个公式来表示:Y = C ×2x。其中,X代表时间,Y代表用户的信息分享量,C代表现在时刻的分享信息量。如果这个公式成立,那么20年后,一个用户的信息分享量将是今天的一百万倍还多,即2的20次方。

小扎推出这个定律是对WEB2.0时代网络用户行为产生的共享数据量变化的总结,其中当然也含有商业目的和对信息产业前辈的模仿因素。如果这个定律成立,那么FACEBOOK的前景不可限量。即使是按照公司目前简单的基于访问流量的广告商业模式,FACEBOOK的年收入也可以水涨船高,永无止境。如果对现有商业模式加以改良优化,再不断推出新的营收方式,那公司未来每年的收入的增长还会长期保持高增长。小扎用这个简明易懂的定律做公关,用来忽悠投资者和合作伙伴,是个非常聪明的方法。这显然受到了享誉信息产业界多年的梅特卡夫定律的启发,这条定律说网络的价值等于网络节点数的平方,网络的价值与联网的用户数的平方成正比,即网络的价值V=K×N2,其中K为价值系数,N为用户数量。

扎克伯格定律真的成立吗?如果成立的话该如何理解呢?如果从个人用户简单直观的体验看这个定律不可能成立。一天只有24小时,每人上网的时间是有限的。如果10年后他的网络行为所贡献的数据量是今天的一千多倍(2的10次方),20年后是今天的一百万倍,一个人怎么可能在有限时间里面对如此庞大的数据量?不能想象一个人十年后阅读的新闻资讯量是今天的千倍,或者二十年后一个人逛网上商城或玩网络游戏的时间是今天的一百万倍。同理,如果从运营传统网站的公司角度看,它们所能产生和使用的数据量最多只能按算数级数增长,和扎克伯格定律一点关系也没有,不可能用来忽悠投资者。

扎克伯格定律只能在诸如FACEBOOK这样的网站里成立,也就是只适用于以个人用户为中心,通过人际关系进行信息互动与传播的WEB2.0架构下的网络服务系统之中。举例言之:按照社会学研究的结果,人们平均而言最多可以有效维持145个社会关系,也就是说FACEBOOK上9亿用户每人可以拥有的朋友数量最多也就是平均145个。如果一个用户和他的朋友们今天只在那里说一句话或有一个动作,那么他会从朋友处得到145条共享信息,同时他自己生产的那条信息被传播给了145人。如果这个用户和他的朋友们明天在那里说十句话或做十个动作,那么他会从朋友处得到1450条信息,而网站中所产生的共享信息量则是145的10次方。换句话说,每个用户的网络行为如果是算数级增长,那用户间的传播,互动,和共享信息则是几何级增长。同传统网站相比较,例如在一个门户网站上,一个用户看一条新闻只得到一条行为记录,多看十条新闻也只多得到十条记录,数据量并不会产生几何级增长的效应,扎克伯格定律失效了。

FACEBOOK的经验数据是说每年共享数据翻一番,其实理论上共享数据的增长应该翻许多番。所以,这条定律并不是一条精确的数学定律,而只是对一种趋势的统计学意义上的描述。不同网站在不同历史时期和不同运营水平上,共享数据的增长幅度也许会不一样。但是,大趋势是不会错的,这条定律会在相当长时期内有效。历史上着名的摩尔定律提出于1967年,但在45年后的今天仍然有效。

回想起上世纪80年代在美国学习社会网络分析时,最大的痛苦不在理论的把握,也不在统计模型的研讨或计算机编程,而在于无处获得大规模的,系统的,完整的,动态的社会网络数据。无奈之下只能采用计算机模拟或者用些局部的简单数据作为分析研究的基础,所以多年来它只是一个小圈子里的自娱自乐的东西,发展不快,影响不大。直到最近几年,确切地说直到FACEBOOK诞生,社会网络分析这门学问在相当大程度上和经济学理论或物理学理论一样,考验的是思维能力,而不是实证水平。正如二战后计算机的诞生促进了大学中计算机科学这个学科的独立产生和蓬勃发展一样,互联网上基于社会网络机制的服务的发展也许会促进作为社会学一部分的社会网络分析的勃兴。没准在不久的将来使社会学从社会哲学和经验社会研究中挣脱出来,成为像经济学一样的科学学科,让诺贝尔奖增添一个社会科学奖项。