从IT时代到DT时代

马云曾经在一次演讲中说道:“人类正从IT时代走向DT时代。”什么是DT,与IT有什么不一样呢?

对于IT,人们已经耳熟能详。马云提出,IT时代是以自我控制、自我管理为主的时代,而DT时代是以服务大众、激发生产力为主的时代。这两者之间看起来似乎是一种技术的差异,但实际上是思想观念层面的差异。

DT时代,数据成为人类的第二母语,互联网不再只是一种技术工具、一种工作手段,它将深刻改变我们的生活方式、生产方式和思维方式,众联、众包、众创、众筹被人们越来越熟知,平等思维、共享思维、扁平化思维、跨界思维、场景思维被人们越来越多地掌握和运用。DT的核心,是关于数据驱动的创新,也就是基于海量数据的巨大价值挖掘为核心的创新体系及模式。如果说IT时代是以信息流为中心,DT时代就是以数据流为中心;如果说IT时代的特点是占有、掌握、传输和控制,DT时代则越来越讲究开放、透明、体验和分享。

按照马云的说法,DT不仅仅是技术的提升,还是思想观念的提升。正是基于对这样一种理念的认同,本书也坚持同一取向,即不谈技术,只谈思想;不谈数据,只谈观念。

从知识时代到信息时代再到DT时代

知识就是力量,信息就是能量。在DT时代,数据就是变量—“数据×”,即乘数效应,乘数改变一切。拥有知识,让作为个体的人战胜了恐惧、无助和无知;信息时代,将爆炸了的知识聚合到一起,激发出不同于工业时代取代农业时代所发生的变化的能量。

DT时代,数据之所以成为变量,是由知识经济时代数据传输的单维到信息时代的双维再到DT时代的多维转变所决定和影响的。数据是多维的,多维数据的智能化集成,转变成为一种多维变量。

在电影《星际穿越》中,有一个五维空间假说。不同于我们所在的三维空间,宇宙学家将时间看作第四维,而第五维指的是能量无界限。把这个五维空间假说引入DT时代,大数据也存在一个五“V”空间:第一个维度是数量(Volume),主要表现为数据量的快速增大;第二个维度是速度(Velocity),主要表现在数据增长的速度在加快;第三个维度是数据的多样性(Variety),即新的数据来源和新的数据种类的增加;第四个维度是数据的价值(Value),即通过对这些数据的使用和挖掘产生价值;而第五个维度也即最重要的一个“V”,就是“数聚”(Variable),它使前面四个“V”的数据发生几何级数的变化,从而让数据实现从量变到质变的飞跃。

正如美国麻省理工学院的埃里克•布赖恩约弗森 曾比喻的,大数据的影响,就像4个世纪之前人类发明的显微镜一样。显微镜把人类对自然界的观察和测量水平推进到细胞级别,给人类社会带来了历史性的进步和革命。大数据具有体量大、结构多样、时效强等特征,处理大数据也需采用新型计算架构和智能算法等新技术。同时,大数据的应用强调以新的理念应用于辅助决策、发现新的知识,更强调在线闭环的业务流程优化。

因此,大数据不仅“大”,而且“新”,是新资源、新工具和新应用的综合体,它将成为我们下一个观察人类自身社会行为的“显微镜”和监测大自然的“仪表盘”。

需要说明的是,物理学中的维度是从数学上定义的。从这个意义上来说,6维、7维乃至更高维度都是有的。现代物理学界公认的理论是8维空间,分为X维(物体的长)、Y维(物体的宽)、Z维(物体的高)、时间维、重力维、电磁力维、万有引力维、万有斥力维。而著名的科学家霍金所提出的宇宙模型,定义了11维空间!

面对从知识爆炸到信息爆炸再到数据爆炸的DT时代,大数据和云计算的发展,呼唤数据处理技术在多维空间的大聚合、大交易、大运算,否则人类社会就有可能走向另一种崩溃—仅从目前在阿里数据平台事业部的服务器上攒下的超过100PB(拍字节)已处理过的数据,就等于104 857 600个GB(吉字节),相当于4万个西雅图中央图书馆,580亿本藏书。仅淘宝和天猫两个子公司每日新增的数据量,就足以让一个人连续不断看上28年的电影。如果折算成每秒需要处理的数据量,相当于是837集《来自星星的你》。

目前,全球仅有两三家公司计算技术达到单集群规模5 000台服器,阿里位列一席。随着数据量的继续增大,即使单集群到10 000台,也依然会触碰到天花板。没有多维立体和穿越式的块数据集成和建构,未来的服务器怎能突破机房的空间限制,实现无限延展?

我们曾一度认为,知识是稀缺的,但那只是因为我们的书架太小了;我们曾一度认为,信息爆炸了,但那是因为我们的存储太小了。DT时代的到来,让新的知识和信息作为一种连接的基础设施和资源,被“大数据×”转换为一种无限的数据变量,从这个意义上说,大数据所能带来的改变和影响一定不只是5维,而是更多维的。它让我们体验数据之美,感受数据之美。用马云的话说,20世纪我们讲了很多服务,不断地增加服务能力,其实客户要的不是服务,而是体验。体验可以让我们在大数据的丰富性中尽情遨游。

块数据是大数据的解决方案

大数据正在对社会生产生活的各个层面产生巨大而持久的影响,政府、企业、个体都在大数据浪潮中享受大数据带来的裨益。

但到目前为止,人类形成的大数据,更多的是以领域、行业为单位,往往是彼此割裂、互不相通的“条数据”,尤其是数据安全性缺乏保障,数据交易缺乏监管,这时,“块数据”的提出—一种以一个物理空间或者行政区域形成的涉及人、事、物等各类数据的总和,相当于将各类“条数据”解构、交叉、融合,实现人人互联、物物互联和业业互联,能真正让大数据落地,成就大数据产业、大数据经济,有效维护大数据安全和监管。

从这个意义上说,块数据让非结构化数据变成结构化数据,块数据是大数据转化为现实生产力的支点,块数据就是大数据的解决方案。

块数据改变了人类对大数据的认知,标志着大数据时代的真正到来。首先,从数据到“数聚”,这是块数据的起点。使分散的、分割的、碎片化的数据聚合为“块”,进而形成一个多维的、无限的变量,这个多维是思维范式,无限是跨界,变量是一种不确定性和不可预知性,这是大数据时代我们认识世界的基础,也是改造世界的方法;其次,从解构到重构,这是块数据的机制。每一次解构的结果都会产生新的物质、能量、要素、权力、意识等的重构,是解构中的重构;再次,从多维到共享,这是块数据的价值。它让每一个人都能快速分享大数据时代人类的文明成果。共享是大数据对人类最大的贡献,共享正在成为一个新时代的标志。所以,得“块”者得天下,得“块”者得未来。

DT时代三个重要标志:块数据社会、慢数据决策和流数据价值。

通过块数据网状结构,块数据社会建立起一个社会化的开放、共享、连接的数据基地和数据综合体;让大数据由重变轻,从粗放到精细的跟踪、挖掘—这是大数据的取舍之道,把有意义的留下来,把无意义的去掉,正是因为“慢数据”所形成的“让数据说话”的优势和条件,才使“快决策”成为可能;流动产生价值,数据成为资产。流数据价值,就是要跳出大数据的黑暗之海,让数据像水一样流动起来,以适当的成本在适当的时间将适当的数据放置到适当的位置,让大数据的价值最大化。

DT时代的数据风险问题不容回避,数据安全成为当务之急。大数据事关国民经济运行、事关社会政治稳定、事关个人隐私保护、事关国家安全利益、事关国家秘密保护。大数据时代,个人隐私、公共空间、国家安全、政府资源、场所交易等面临着前所未有的安全威胁,亟须健全的法律保障。“棱镜门”和“RSA后门”事件的发生,千万级数据泄露的安全事件逐年递增,涉事范围覆盖了军事、经济等重要领域。

同时,由于大数据主要来源于大联网、大集中、大移动等信息技术的社会应用,大数据已经成为网络社会的重要战略资源。它将网络空间与现实社会连在一起,将传统安全与非传统安全熔于一炉,将信息安全带入一个全新、复杂和综合的时代。

必须指出的是,安全问题不是回避和拖延我们向大数据进军的借口。大数据的问题必须用大数据的思维、技术和方法解决,必须以大数据技术对抗大数据平台安全威胁。2015年将迈入信息安全建设的高峰期,伴随国家禁止采购Windows 8(微软开发的一款操作系统)、禁用赛门铁克数据防泄漏产品等政策的提出,政府、金融、互联网等主流行业数据安全建设势在必行,数据安全标准的建设也将应运而生。

块数据的提出,给出了一个数据安全问题的有效解决方案。首先,在块数据上,围绕数据安全的产业并购将推动大数据产业战略布局的重构,并通过这种重构推动数据安全人才、技术、产品和客户等方面资源在“块”上的进一步汇集,并通过强强联合、优胜劣汰,使数据安全品牌集中度显著提高。其次,在块数据上,国家及社会机构在信息安全领域的投入有望大幅提升,政府作为数据交易的监管体系建设的主体责任进一步明确,从而在整体上提升宏观层面的数据安全水平,将为我国的信息安全产业带来前所未有的发展机遇,更是块数据未来最大的机遇。
块数据就像一个计算机的主板,它建立起了一个开放、共享、连接的数据基地,而各个行业和部门的条数据就像一个个可插可拔的板卡,它们只有融合和集成到主板上,通过计算、应用和数据资源从“条”到“块”上的融合与集聚,实现块数据的解构与重构。

例如,阿里小微金融服务集团目前已经通过数据为70 多万家小微企业贷款,而且没有对一家企业进行过实地考察,只通过块数据的聚合和分析,就实现了良好的风险控制。这个例子告诉我们,当数据在一个物理空间或者行政区域实现交互、连接、连通和分享的时候,它就变成了多维变量,这种变量作用于各种资源的配置,就会优于通过竞争而导致的市场化最优配置。这完全颠覆了西方主流经济学的基础理论。如果说,目前中国的经济学界还没有能够拿到诺贝尔奖的实力和条件的话,那么,块数据理论就是一个具有诺贝尔奖水平的课题,随着理论和实践的不断深入,我们正一步步走近真理。
 


大数据战略重点实验室 著
连玉明 主编
中信出版集团2015年5月出版