柴洪峰:中国银联的大数据实践与思考

在中国大数据大会上,中国银联执行副总裁柴洪峰教授与大家分享了中国银联金融大数据探索与实践,编辑特此整理成一篇案例介绍,见下文。

背景介绍

大家都知道中国银联是2002年成立的银行卡的组织,现在中国银联有400家成员机构,400家银行是中国银联的合作伙伴。银联成立12年来,已经成为发卡量全球第一的银行卡组织,网络规模已经遍及全球142个国家,交易规模全球第二,银联产业,成就伙伴,惠及社会,人类社会从纸货币到电子货币这个过程当中,银联要行使这个职责。

柴洪峰教授介绍说:“中国银联有丰富的大数据资源,涉及43亿张银行卡,超过9亿的持卡人,超过一千万户的商户,每天有七千万笔的交易数据,每天核心交易数据都要超过TB级,我们银联的数据资源无论宏观层面还是微观层面都有很高的价值。这个价值体现在哪?我就要说一下银联的数据价值,支付数据的特点是更具参考性,他们可以衡量真实的购买行为,从而促进用户定向,个性定价,产品推荐,用户忠诚度和流失建模等策略。”

压力与挑战

银联开展大数据工作有很多背景要素,从银联支付数据看,银联数据处理过程中也遇到了挑战。银联原来的处理方法已经满足大数据的需求,从银联自身业务看,很多精细化的业务也需要大数据的强力支撑。从合作伙伴角度来看,合作伙伴对多样性的数据服务有需求,从电子商务这个行业来看,通过大数据的挖掘来提升行业发展水平。从国家示范项目建设来看,大数据相关工作也是银联承接国家项目的工作重点,银联也在这方面加大了力度。银联对大数据有个指导思想,首先我们希望整合各类内外部的数据,通过大家合作,基于这些数据,建立相应大数据基础设施,可以使这些数据可以安全方便获取,基于大数据的平台,我们会开展大跨度的数据统计分析以及深度化的数据挖掘工作,这些分析和挖掘工作对外对内合作伙伴都进行服务。

大数据系统实践

银联大数据分四个层次,这个层次就是基础数据,基础平台,基础数据,模型研究和应用服务,建设大数据平台是银联开展大数据工作的第一步,有一个云平台,充分汇集各方面的数据,我们集成常见的分布式机器学习算法,我们已经支撑了十几个业务应用系统在实际生产着。我们和新华社一块联合发布了银行卡消费信心指数,BCCI,通过这个指数可以读出居民消费水平和居民消费结构的变化。银联大数据也在BCCI指数上有所体现。我们利用大数据,也为持卡人提供数据服务,首先持卡人可以通过银联钱包这一手机APP平台,查询到自己各张银行卡的历史交易。同时可以向持卡人提供更为丰富的持卡人帐单这些服务。客户的细分工作也是今后电子商务与电子支付行业的热点和重点,银联大数据实践,基于外部数据和数据量化的指标以及数据总体特征,基于数据量化指标,我们可以分析出每个持卡人的个体特征,基于持卡人个体特征和总体特征,我们可以为持卡人打上各类类型的标签。如商旅标签,医疗标签,购车标签,形成我们每个人购买习惯、生活习惯的图象。除了持卡人维度,我们在商户维度上做了相应的工作,我们为商户提供相应的商业智能分析,可以使商户认识到自身的经营情况,我们还为商户提供同业商户的比较,为商户提供最佳合作对象,也是他这个链条当中的合作对象的联合服务。同时我们也为商户提供了客户忠诚度、流失商户的分析、回头客的分析等等。

同时我们大数据还应用到了风险控制领域。我们利用机器学习的方法,对银联历史数据进行挖掘,得到了七大交易的判断模型,可以对银联转接交易系统进行实时的判断。银联大数据还有一个实践,就是数据集合工作,这源于我们对大数据不同阶段的认识。我们认为大数据从1.0、2.0、3.0不同发展阶段,各阶段的成熟度逐步提升,我们很清楚银联大数据资源有很高的质量和价值,但有些不足。使得我们对终端客户的到达能力还是有限的,因此我们希望通过数据的集合工作,融合内外部的数据,从而使银联的数据得到价值的提升。

我们在数据集合方面尝试从两个角度,第一利用公开的外部技术进行集合,我们利用爬虫技术,在互联网上找持卡人、商户的信息。另外通过合作伙伴的数据进行集合,如通信运营商的相关数据,大家都知道斯诺登事件,说一个消息,如果利用一个月你的电话信息和一个月的信用卡信息,基本上分析这个人是什么样的人,什么行为的人,是什么家庭背景的人,就能分析出来了,我们现在正在和通信运营商来做这项工作。

对于金融的大数据,我们还是认为这将是大数据最有可为的领域之一。金融机构可以说是大数据天生的合作者,一方面自身有着强烈的利用技术红利带来收益冲动,另一方面又有国内较好良好的信息化基础,从数据层面,金融领域有着优质的数据资源,从技术层面看,金融企业的技术团队也有强大的实力,从思维层面看,金融行业拥有最专业的金融能力,可以研究和开发最专业的金融大数据的产品和服务。面向金融大数据带给行业的变革将是全方位的,例如在信用风险评估方面,实际我们征用系统还有待进一步挖掘,服务于这个社会。同时也可以在客户服务方面基于大数据的技术,也可以实现对客户智能化的服务。在智能运营方面,大数据技术也可以对金融企业的数据进行分析,从而帮助金融机构进行运营决策,降低成本,在产品创新方面,大数据参与新产品的设计,结合各方的数据,使企业产品推陈出新。总之金融服务将从粗放式管理转向科学化的管理,从以利润为中心转向以客户为中心。银联大数据将围绕客户服务展开,结合内外部的资源,形成对持卡人的各方面认知,如消费习惯、生活习惯,基于持卡人的认知,我们可以形成持卡人的响应预测。比如精准营销,个性化服务,在商户层面,我们同样会基于大数据的资源,形成对商户各方面进一步深度的认知。如商户的客户群体经营状况,基于这些认识,我们将会形成商户的响应预测,如商户的发展预测,信用评估。

银联大数据工作将围绕提供稳定、高效、丰富的数据服务开展工作,我们还将提升大数据系统的稳定性和效率。我们认为在大数据快速发展的背景下,合作共赢是大势所趋,合作共赢第一方面是数据的互补,数据的共享,可以融合,创造新的价值。第二方面是资源的互补,资源的协同合作将带来挖掘能力的提升,合作共赢的第三方面是业务互补。业务的互补与互用将发挥出大数据的最大效用,通过数据、资源等多方面的合作,必然可以产生众多联合跨界的创新成果。可以给大家大数据建设带来更广阔的想象发展空间。合作共赢是银联的一贯态度,我们的合作领域可以在很多方面,包括技术交流合作,数据的开放共享,模型模式的研究,行业的最佳实践,以及数据的应用合作,银联愿携手各方合作伙伴,共建银行卡产业的大数据生态系统。

技术展望

我们对大数据的展望。首先大数据是在发展中完善的。在很多角度都体现了两面性,大数据一方面在很多行业被广泛应用,一方面又不够成熟。大数据使用了全新的技术框架,但有时又不适宜传统的应用场景,大数据概念已经充分被解读,但高价值的应用却不丰富。大数据一方面百花齐放,一方面存在应用对接不平滑的现象。我们认为再经过一段大家的努力,大数据的价值可以得到进一步的凸显,但是是不是一个通用性的技术,有待考量。

第二个感悟,关于数据开放中的信息安全问题,数据开放带来数据价值的提升,带来1+1>2的效果,但是也会带来信息安全的问题,如个人隐私泄露的问题,更好的提升大数据的价值,我们需要法律政策层面的指导。更需要政府和企业的众多尝试,也需要在座各位朋友们大家互相支持,能够产生合作。