全国有74项大数据发展政策 但行业仍存在四大挑战

“全国已经有23个省市出台了74项与大数据发展相关的政策,从京津冀,长三角,珠三角以及中西部,都在不断推动大数据发展。但从行业看,依然存在巨大的挑战。”

工业和信息化部电信研究院政策与经济研究所副总工程师、教授级高工,西安邮电大学经济管理学院客座教授何霞在日前举行的“首届中国大数据应用大会”上表示,经过几年的发展,我国已经基本形成了上游数据,中游产品,下游服务的大数据产业体系,比较大的大数据企业有两百多家,企业人数规模从几十人到几百人不等,2015年行业产值110亿左右。

何霞

从数据量看,我国已经进入数据增长爆发期,从2012年开始我国数据量每两年翻一番,预计到2020年数据量将达到8060EB,约占全球数据量总量的18%。从种类看,最大量的是互联网及通讯网数据,其次是制造业,第三是政府数据。

但是,何霞认为,在大数据大发展的背景下,我国在个人数据保护,数据跨境流动,数据交易规则建立,以及政府数据开放四个方面存在很大的挑战。

数据保护:已有信息保护制度失效

首先,在数据搜集环节,用户众多,数据量也比较大,这带来两个较大的问题,一个是透明度低,因为用户不知道后台在搜集自己什么信息,另一个问题就是全面追踪。

以前,个人征信仅限于央行征信系统,现在除了央行征信系统以外,互联网公司也在做自己的征信系统,比如BAT的征信体系,数据来源涉及到网络交易、社交数据等互联网数据。这些数据量非常庞大,有利于BAT对数据进行大量的挖掘。这也与传统的征信形成了协同可能。

传统上,央行信用体系包括银行贷款信用,交纳水电费的信用等一些比较静态的数据,未来信用体系的发展,一方面是央行的体系,另一方面有可能是互联网公司和大数据公司的征信体系的发展,两者相结合将形成我国非常全面的征信系统。

其次,在数据分析环节,互联网征信通过数据挖掘可以分析出数据背后的深层信息,因此存在大量的风险。作为个人,不知道最后挖掘出什么样的情况,最后这种分析会产生什么的影响;再就是数据挖掘之后数据的流转环节,这个环节的控制力非常低。

比如,当我们下载APP的时候,系统问用户是否同意敏感信息的采集,如果不同意就无法使用这个APP。虽然它采集的数据个人觉得没有多大的关系,但是这些公司会不会把这些数据作为商品去转售?你不知道;同时,你也不知道自己的数据会转卖到一层、二层、三层、四层。越往下越没有控制力。这意味着,在数据安全方面暴露出非常大的风险,并且危害范围也不可控。

何霞指出,应用传统的管理办法或法律法规监管大数据,在操作层面非常困难,一方面个人数据的界定是模糊的,当前,不知道哪些数据应该是保密的,哪些数据是不应该保密的。另一方面,数据范围的无限扩展,过去我们认为,个人数据信息就是公民的身份证号码,电话号码,但是现在,我们会发现位置信息甚至成为最敏感的信息。第三,数据多番流转和后续利用也无法保证能够遵循当时原始采集的目的。第四就是知情同意,数据流转的复杂性使得用户知情同意难以有效行使。第五是主体责任,流转和交易都会涉及到多方主体,难以清晰界定。

“这几个方面的情况,导致传统法律无法解决,传统的信息保护制度已经无法适应大数据时代发展的需求。”何霞表示。

跨境数据流动错综复杂

当前,全球对数据跨境流动依然没有明确定义,但基本上有两个角度,一个是物理层,数据跨国界传输和处理就叫跨境流动。比如中国有国际网关,数据出去了就叫跨境流动,非常清晰。还有一个是逻辑层,数据没有跨国界,但是数据能够在第三国被访问了,这是不是属于数据跨境流动?

从模式上看,跨境流动有四个模式,第一个模式是跨境交付,也就是说提供跨境服务的同时相关数据也就过去了,因为跨境数据流动必须要依托于跨境服务的提供,也就是说如果有跨境服务提供就百分之百会产生跨境数据流动,这两个是完全联系在一起的,所以这是跨境交付会产生这样一种流动。

第二个模式,商业存在也会产生数据流动,比如沃尔玛在中国设立一个商场,它是全球的配置,商品也是全球的,包括它对消费者的分析也是全球的,包括仓储,供应,物流都是全球的,因此沃尔玛在整个服务中,中国的数据和其他国家的数据都有可能进行跨境的流动。

第三个就是境外消费,包括留学、出国等等。第四就是自然人流动,包括法律咨询等等。

以上四个类别中,最重要的是跨境交付和商业存在。而实际上,2015年全国互联网跨界数据量的分析已经超过了1ZB。

从全球数据跨境流动安全与风险的角度,首先看数据泄露风险在什么地方,第一,境外当地数据保护有可能是不足的,数据流转到境外了但是数据保护不好。第二,境外当地执法部门也有可能会强制要求披露相关信息,比如之前美国政府要求谷歌、Facebook、苹果要披露一些涉及到防火墙和国家安全方面的信息。再有境内侵权行为很难维权。

从丧失数据资源优势的角度,可以看到各个国家信息基础的能力是不一样的,所以导致在搜集、处理、运用数据的能力上也是有差异的。比如美国等一些强国就掌握了大量的关乎整个经济、社会、军事、国家安全的关键数据,从而形成信息资源优势和战略控制能力。

在数据安全问题上全球有一个里程碑事件,就是斯诺登事件。通过斯诺登事件,各国对数据、信息安全都比较谨慎。

目前,各个国家跨境数据流动的管理模式是不一样的,许多国家会要求它的服务器必须要在本地,中国也是这样,中国要求外资企业必须把它们的数据服务器放在中国,否则不同意它在中国进行经营。而以美国为首的是倡导自由的流动,因为它是互联网发展最好最强的国家,信息技术也是最强的国家,服务器也在它那里,所以它的流动性和获取信息能力是最强的。

数据交易规则缺失,交易标的存在巨大争议

我国关于数据交易规则的缺失,使得数据交易处于产业探索的阶段。这涉及到两个大的问题。

第一,数据权属不明确。数据的权利类型没有得到共识,部分数据权利主体也存在争议,比如行为数据到底属于谁?又比如位置数据到底是属于自己还是属于采集数据的公司?

在这方面,有两种说法现在一直争论不下。一种说法是,这个数据属于个人,但还有一种说法叫做投资原则,就是互联网企业投了大量的资本在做相关的互联网应用,那么个人在下载APP的时候是同意个人数据被使用的,所以这个问题上还没有明确的定义。

第二,数据交易标的问题,争议非常大。对于哪些数据是可以交易的,或者哪些数据是禁止交易的,目前都没有规定;再有就是数据资产评估存在困难,数据定价公式是什么,供方定价是什么,拍卖怎么拍卖,买方怎么出价;数据安全也是最大的担忧,数据平台,控方,买方,对于其控制数量都是需要从各个方面保证它不泄露,但是现在这块又很难做到;再有就是数据交易机构也没有明确,缺乏一个监管机构对数据交易和数据交易中心的纠纷进行监管。

政府数据开放知易行难

政府是数据资源的重要拥有者。在全球各国,美国倡导数据开放,但涉及到数据的准确性等问题,因为不准确的政府数据会带来巨大的影响,所以美国在政府数据开放中,花费资源最多的就是切割数据,核准数据是否准确。

目前,在政府数据开放中涉及很多问题,比如法律问题,隐私保护问题,信息安全问题,信息自由问题,以及各个部门信息立法的问题。再就是涉及到众多政府部门和公共机构协调,难度特别大。

当前,中国之所以在政府数据开放方面还在慢慢的向前走,速度不是很快,核心就是部门之间的协同,这包括不具备数据开放的组织,文化,流程,管理等等,以及开放数据涉及的一些具体问题也需要进行界定,比如开放渠道,范围,豁免,格式,标准等。

“要落实大数据行动计划纲要,首先要开放一些高价值的数据。一些没有争议的,惠民生的,易开放的数据要先行,再有要推动政府数据跨部门的共享,所以要加快数据的互联互通和信息共享,丰富面向民众的信息服务。”

构建大数据监管框架

何霞介绍说,未来要构建的大数据监管框架,就涉及以上四个方面。

首先要加强个人数据保护,这需要推动专门立法,现在关于个人信息保护分散在不同的法律规定和政策规定中,但是没有一个专门的立法提出来要保护个人信息。

再就是要细化一些执行规则,比如:某些重要的要保护,但哪些是重要信息,哪些是敏感信息,这需要具体规则。同时,要强化行业管理,推进行业自律,完善数据保护标准体系,以及发展第三方评估,包括认证体系。

第二,在跨境数据流动方面,首先的原则就是保护产业,因为国内的云计算、大数据产业尚未形成大规模,因此我们需要数据分级分类管理,加强跨境业务境外合作和协同监管。第二要保护安全,重要行业数据以及涉及国家安全的数据要强调实施跨境数据流动安全风险评估。第三要保护资源,也就是占据数据资源从而可以获得整个国家在国际竞争中的竞争力,因此要建立跨境数据流动监测手段和立法。

第三,要建立数据交易规则,明晰数据产权,抓紧确立数据交易规则,建立大数据交易隐私与信息安全评估机构,涉及隐私与信息安全问题要求交易方履行充分的匿名化的义务,安全风险比较高的要限制交易对象,并且通过合同对购买方提出要求。

第四,继续推动政府数据开放,一方面要政策引领确定国家层面的计划,第二要机构推进,第三要有不同的措施,再就是需要有制度保障,要确立开放数据的原则,要建立数据管理的相关制度。