川大陈良银教授:大数据资产化管理和可控共享解决方案

2024年4月24日,由DOIT传媒主办的2024数据基础设施技术峰会在美丽的天府之国成都世外桃源酒店盛大召开。

本次峰会以“释放数据要素价值”为主题,聚焦算力与存力协同,围绕智算中心技术创新、分布式存储技术与应用等多维度热点话题,邀请数十位数据科学家、IT专家、领先企业以及行业用户代表,通过一场主论坛和两场场专题论坛,与500多名现场代表及5万多位线上嘉宾一起共同探讨实现数据价值的最大化挖掘,共塑企业和社会的未来。

四川大学工业互联网研究院副院长、博士生导师陈良银教授应邀出席峰会,并以“大数据——资产化管理和可控共享解决方案”为主题发表主旨演讲。

四川大学工业互联网研究院副院长、博士生导师陈良银教授

社会进步过程中,每天都产生着大量的数据。把这些数据的价值发挥出来,让数据实现流动,对生产关系势必会产生重大改变,对未来社会也会产生根本性的影响。

从原始社会到今天,货币的产生对社会的发展可能起到根本性的作用,很难想象货币不流动或者没有货币,这个社会将是什么样的情况。货币从起步演化到今天的银行,是一个漫长的过程,货币银行对社会的贡献是显而易见的。

未来有没有一种可能性,比如数据或者数据背后的符号,也可能对社会产生根本性的影响?比如智算中心,它的价值和作用也是显见的。某种意义上,智算中心更多的是点对点的价值,要想真正让数据产生普适的价值,人人都从数据中获得价值,这时候用什么方式来管理呢?未来的数据银行,也许有可能产生现在货币银行一样的价值。有可能到那一天,人们都没有感觉到数据银行的存在,它变成了一个真正的基础设施,对社会产生了根本性的影响。然而,现状是,数据价值的发挥面临困难,想用又用不起来,原因在于数据的共享并没有从根本上解决好。

陈良银教授的讲述包括三个部分:一是大数据产业链,二是大数据银行模式,三是数据银行应用,用大数据银行的模式,让数据共享起来。

大数据产业链

在当下,互联网、云计算、大数据的基础设施以及应用都跟数字经济高度相关,数字经济涉及到方方面面,比如基础设施、信息互联网、产业互联网、移动互联网、物联网;云基础设施涉及硬件、软件、系统等方面,大数据基础设施包括采集、汇聚、管理、分析、挖掘、应用和共享全生命周期,积累了大量的数据。基于人工智能的应用对数据的需求更大。

数据的特点是量大、多样、价值稀疏。数据还有一个巨大的问题,那就是特别容易被拷贝。

整个社会,人人都有数据,政府有数据,企业有数据,人人都知道数据越来越值钱,在某种程度上,数据其实是个人和企业的生命。

对于大数据产业链来说,采集与汇聚,是把数据采起来汇聚起来,各地建立了大数据局、大数据中心,也是这个目的,但在数据的汇聚上也依然存在问题,各部门之间不太愿意把核心数据拿来直接分享,因为每一个部门、每一个个体都关注自己的数据价值。

要保护数据价值,又想挖掘别人数据的价值,这不单是技术问题,还涉及到技术管理,法律等问题。如果没有国家背书,数据产业的发展其实还是比较难的。

如何让数据更值钱呢?共享是关键。但问题是共享并不好解决,只愿意拿别人的数据来挖掘价值应用,这样的模式就不能运转起来,可能只有一小部分点对点的交换或者交流,这种方式可以理解为最早的以物易物,但从更多的数据里面挖掘价值就没有可能。联想到以物易物导致货币的产生,未来的货币共享应该有更广阔的空间。

如何管理、如何激励共享,让数据背后的资产化、价值化?

首先就要科学计价,确权、计价、溯源其实非常困难。数据的确权和授权涉及到所有权、管理权、使用权、收益权、知情权、隐私权等等,所有权、管理权、使用权三权可以分离,溯源是要从数据的全生命周期追溯数据的产生、共享、使用以及演进和整个过程,包括更新维护、失效退出,构建起这样一个追溯链。

大数据银行模式

大数据银行模式提供了共享管理是一个可行的手段。

这种模式来源于货币银行的思路。有了法律的认可的确权和计价方式,以及背后的国家背书,这个数据就可以交给数据银行,由数据银行来进行管理,然后产生价值、提升价值,然后再分享价值。

从这个层面,算力中心还是属于一个试点。货币发展过程中的某一个比较起步的阶段,发展到货币银行还有一定的路要走,还应该有托管方、管理方的功能,托管方起到数据汇集的作用,不管哪些类型的数据都可以汇聚过来,也起到管理方的功能——所有的数据托管方都有信任,还有相应的标准,因为有这些标准,管理基于一整套的技术,也是服务的提供方。

这样,数据最能发挥价值的可能还是数据银行。算力中心很可能成为数据银行的一个部分或者说伙伴,算力中心的模式还得进一步上升,上升到更宏大的概念,对社会的影响更大。这是数据银行基本的功能。

数据银行的三类应用

数据银行的应用大概分成了三类。

一是政府数据银行。政府数据银行以示范为主,目标不是盈利,虽然盈利也是一个诉求。政府的信息化比较好,数据质量非常高,所以有效运营增值的可能性比较大,涵盖的数据种类也比较多,产生的作用会比较大。

二是个人数据银行。个人数据银行已经有了相应的标准,比如个人征信数据,美国的标准、国际国内的标准,涉及到隐私等各种内容。但是从某个角度,隐私其实是一个平衡,要做到绝对隐私不可能——否则数据银行或者共享的价值就低了,绝对公开更不可行。这就需要一整套的平衡技术。

四川大学前几年也探索做了一个名叫“数汇宝”的个人数据银行产品,但要让它形成气候,可能还非常早,仅仅是一个技术探索。

三是企业数据银行。企业将数据当作自己的核心资产,虽然生命就在这些隐私数据里,但未来社会不管人们是否注重隐私,如何注重隐私,或者数据多么保密,数据洪流和技术洪流一定会驱使以数据银行或者说更高端的模式去影响整个社会。

无论从货币银行角度,还是当下很火的大模型,其实数据才是基础的基础,如果数据不能流通起来,算力和算法的作用都不能充分发挥。

数据银行很有可能像货币银行一样,对社会产生巨大的价值。