2013年,“大数据”的概念风靡全球,一些发达国家已经上升到国家战略资源的高度进行研究和利用。在社交网络、互联网、云计算、物联网技术相继出现在人们工作和生活中的背景下,“大数据”与国家统计局局长马建堂提出的“政府服务型统计”有什么联系,将对政府统计产生哪些重大影响?
维基百科认为,“大数据”是一个难以通过现有数据库管理工具进行处理的大而复杂的数据集的集合。所谓大数据时代的政府服务型统计,就是通过对“大数据”的开发,为党政机关和社会各界人士提供更为广泛的、满足不同层次数据需求的“大服务”。
“大服务”之“大”,在于服务的理念之“大”、对象之“广”。服务型统计摒弃过去政府统计部门长期以党政机关为单一服务对象的观念,以满足更为广大的社会群体(包括投资者、企业经营者、个体经营者等)对数据产品的需求为己任,不再单纯依靠“我布置、你填报”的传统数据采集方式,而是在强调依法统计、独立上报的同时,引导国民利用数据产品服务生产经营和社会活动,创造生产力,提高数据价值意识,进而积极参与到各类数据采集、分析、使用的环节中来,调查者与调查对象建立一种合作互惠的新型关系。
“大数据”催生“大应用”
随着大数据时代的到来,传统数据仓库性能已无法应付处理庞大数据信息的需求,但大数据技术使我们能够访问和使用大规模数据集,以应对越来越复杂的数据分析和制定科学的决策。
在政府层面,大数据将打破政府各部门、政府与民众之间的“信息孤岛”现状,实现数据共享,跨系统、跨平台、跨数据结构的政府综合信息处理平台将在技术上使政府内部纵向、横向部门得以流畅协同;数据获取、处理及分析响应时间大幅缩短,提高工作效率,降低政府开支;数据产品创新应用将会不断涌现,政府信息的经济价值将被充分发掘;全球著名的咨询公司麦肯锡估计,欧洲发达经济体政府利用大数据可以节省超过1000亿欧元的政府开支。以上海市金融业为例,自2006年起,人民银行上海总部公开金融信息后,催生了一批金融信息咨询服务企业,其中有上海联和金融信息服务有限公司等5家上市企业,拉动了十几万人的就业。
大数据提高政府决策的科学性、精准性和预测预警能力。大数据超越了传统的数据分析方法,既能对结构化数据进行分析挖掘,也能对言论、图表、图片、视频等半结构化或非结构化数据进行深度挖掘分析。如Google关注特定检索词条的使用频率与流感在时间和空间上的传播联系,监测和预警流感爆发的时间和范围。在2009年甲型H1N1流感爆发时,Google预测比官方的报告早2-3周,是大数据预警预测应用的一个范例。
在企业层面,目前衍生了许多基于大数据分析的商业模式,应用最多的是数据分析、广告推送、市场细分和产品创新。
以电子商务领域为例,国内著名电子支付平台支付宝,正利用大数据影响着公司的经营决策和业务运作,同时对各种消费群体进行细分。目前,通过利用“PC服务器集群+开源软件”、采用Greenplum数据库软件等手段,支付宝每天可以对近300亿条用户交易数据进行查询,通过对网民的网页浏览记录、购买商品记录,分析个人的喜好和消费习惯,进行商品类比,进行有针对性的营销和推送。也可根据不同的消费群体,研发不同的产品,确定相应的产量。
“大数据”面临“大挑战”
从大数据应用来看,不但应用于客户细分、投资决策和社会行为分析等范畴,还影响和推动着政府统计机构和统计工作的变革。
大数据对政府统计的职能产生重大冲击。从现已发生的变革来看,包括进出口、货币供给、财政等数据在各项相应的行政记录里均可查询;物联网使物品和网络连接起来成为可能,进行信息共享,工业生产、运输物流、终端消费、公共服务等各种交易直接生成可用的数据,而不需要再经过专门的统计采集。现行的一些统计指标,如工业增加值、固定资产投资等数据的参考价值有待商榷。
大数据对政府统计的权威性产生重大挑战。随着大数据时代的到来,以电子商务、即时通讯、搜索引擎和网络游戏为主体的互联网经济发展飞跃,政府统计部门不再是海量数据的唯一拥有者。以淘宝网为例,每天约有6000万用户登录,每天的在线商品数已经超过了8亿件,平均每分钟售出4.8万件商品。一个综合性的淘宝指数应运而生,用户可以查询淘宝购物数据,了解购物趋势。消费者可能更加关注淘宝指数,而不是“社会消费品零售总额”、“居民消费价格指数”等统计指标。
大数据对政府统计信息化建设提出更高要求。一是亟需建立政务信息数据共享平台。在符合《保密法》的前提下,实现政府各部门行政资源和数据资料的横向和纵向共享。就统计机构内部而言,建立联网直报系统与数据统一处理平台,将已联网直报的“三上”企业和以企业为调查对象尚未上线的专业、以非企业为调查对象的专业及其他部门统计数据的“大融合”,实现国家与地方之间数据方便友好的转换,满足不同层级的需求。二是亟需提高数据的挖掘分析能力。目前,对结构化数据的挖掘已有比较完善的方法和工具,对大数据中包含大量的文字、图片、视频等非结构化数据进行分析,生产出高质量的统计数据产品为公众服务是一个重大课题。
“大数据”推动“大变革”
大数据将推动政府统计的整个统计理念和统计流程的“大变革”。现阶段应立足于国家统计局推行的企业一套表联网直报系统、手持PDA采价系统和部分地区推行的一体化电子记账系统,扩大地理信息系统、遥感测量技术在统计调查中的应用,推动物联网技术与统计调查专业、云计算技术与数据挖掘分析的结合,以促进数据信息平台的“大融合”、数据信息产品的“大服务”为主要目标。
美国在2009年初,就把大数据上升到国家战略资源的高度。近日,“棱镜门”事件在世界的持续发酵,可见大国间在网络数据空间的博弈。大数据时代,国家层面的竞争力将体现为一国拥有大数据的规模和对大数据的运用能力。建立大数据时代的政府服务性统计,不是单一的“唯技术至上”,也不是只盯着统计方法制度改革,而且需要具备一种战略思维,需要“大智慧”。
首先,可以通过大数据技术对大量的相关指标的分析研究,对现有的统计数据进行第三方印证、评估,从而提高统计数据的质量和可信度。其次,本着提高效率、切实减轻基层负担的原则,在网络化程度较高的行业,如电子商务产品交易统计、社情民意调查等,用大数据分析应用直接替代现有的专业统计调查。再次,利用大数据技术,促进现有政府全面统计和抽样调查制度的改进和改革。最后,从组织和制度建设上,政府统计部门应及时整合、组建大数据研究机构,协调有关部门制定大数据分析研究的规范和标准,全面开展大数据研究。鼓励和扶持更多的高校科研机构、社会组织和企业进行大数据分析研究。
总之,建设大数据时代的政府服务型统计,政府统计改革和大数据研究要相互促进,成果互化,相得益彰。