360傅志华:互联网大数据的发展方向

2015年12月9日,由DOIT和易会联合主办,中国软件行业协会和中科院计算机网络信息中心大力支持的“2015中国数据经济峰会暨易会CIO峰会”在北京悠唐皇冠假日酒店隆重举行。来自中国企业500强CIO、CTO,知名互联网公司代表及数据经济领域的创业者、投资人围绕“数据驱动商业变革”展开了深入的探讨与交流。
 
360大数据中心副总裁傅志华发表了“互联网大数据应用与展望”的主题演讲。大数据很重要的发展驱动力是网络的发展。在当前互联网大数据里,手机已经超越了PC,移动互联网已经成为互联网大数据的重要的驱动力。
 

傅志华表示,大数据是企业的无形资产,如果不重视数据的整合和数据质量,最后企业要精细化运营时,数据就很难起作用了。解决这个问题最好是通过技术的方法来解决。他介绍,在360内部,前几年也碰到过这个问题,数据质量不理想,后来用了一套技术方法,做了一套统计SDK的解决方案,只要用户们接入数据SDK服务,就不会存在数据质量的问题。

 
“未来互联网大数据很重要的方向,将是通过图像识别的手段,让计算机更加聪明,更加知道身边的环境是什么样的。收集完这些数据以后,再给客户更好的反馈和体验。”傅志华说。
 
以下为演讲主要内容。
 
各位领导、各位来宾大家下午好!非常荣幸有机会在这里跟大家分享互联网大数据的应用。我看到在座很多专家和学者感觉到非常鼓舞,因为我看到了不同行业的专家都在关注大数据,我相信这是一个很重要的信号。大数据肯定是未来很重要的生产力,就像科技一样,科技是很重要的生产力,我相信大数据也是。
 
今天我主要聚焦在互联网领域,刚才有航空界的专家。我跟大家分享一下在互联网领域里面,大数据主要的应用场景,包括未来重要的方向。首先跟大家分享一下我自己的感受,互联网大数据很重要的发展驱动力是什么?除了我们看到很多大数据的技术,除了数据处理、数据仓库的技术,随着处理技术的成熟和发展以外,很重要的是因为网络的发展。
 
这是今年上半年中国网民数6.7亿,相当于中国有一半公民上网,这一半里面很重要的,有89%的网民是通过手机上网,相当于有6亿手机网民。对于我自己亲身看过移动互联网,是什么时候超越了PC互联网?我在前几家公司都看到一些重量级的互联网产品,手机端的活跃度在2011年已经超过了PC端的活跃度,我是亲眼看到的,它超越了PC互联网。互联网大数据里面,手机超越PC的特点,手机网民为主的特点给我们什么样的启发和注意点,我们要利用互联网大数据去优化我们的商业银行或者传统行业借用互联网的时候,要利用移动互联网的大数据,我们要做些什么呢?我分享一下我自己的亲身感受。
 
你们想想,移动互联网数据和PC互联网数据有什么最大的同?手机是可移动的,移动就意味着你有很多场景化的信息,在PC互联网的时代,几乎是没有的,或者很难采集到的,场景化信息,比如说位置信息,PC互联网是IT地址,现在我们看到移动互联网时代,除了经纬度数据以外,更精确的知道你在商场里的第几层,在哪个区域都可以知道。这些场景化的数据跟PC互联网是完全不一样的。我们利用移动互联网的时候,一定要注意这些特点,有很多场景化的数据。
 
为什么说移动互联网是互联网大数据很重要的一个驱动力?我们做大数据最核心的是有数据,以往采集数据的方式有很多,通过摄像头也可以采集,通过人工记录也可以采集,这种效率低,成本也高。我们日常看到很多公路上的摄像头,处理成本很高。但是移动互联网给大数据带来一个什么好处?数据采集成本显著降低,只要你使用应用里面,这个应用有数据打点上报就有可能采集到你的数据,这个成本是非常低的。比如说摄像头头像识别,这种处理成本相对很低,而且移动互联网的数据有一个特点,除了场景信息以外,还有一个特点,记录人全方位的行为,因为手机是随身携带的,对于一些大型互联网企业来说是有机会了解到您的生活轨迹,你的兴趣偏好的。如果是你愿意把数据上报给它的话,在PC互联网时代是做不到的,这个也是移动互联网对互联网大数据很重要的驱动。
 
另外一个是什么呢?移动互联网又是很好的一个数据应用的渠道。就是因为数据要产生价值嘛。回到刚才我说的摄像头,比如说这里有一个摄像头监控我的情况,它会跟我有什么交互和反馈呢?交互和反馈的能力是比较难的。但是移动互联网很容易,如果我猜到你有什么样的简单需求,可能手机就给你反馈一条相关的你感兴趣的商品信息和感兴趣的功能体验。为什么这两年互联网大数据发展这么好,我认为很重要是移动互联网的推动。
 
另外一个反向的压力是什么?PC企业从互联网转到移动互联网时代有一个很重要的特点,对于产品来说有一个更大的挑战,为什么呢?因为我们看到电脑屏幕,一般都是十几寸,PC电脑屏幕十几寸,手机屏幕一般也就五六寸已经比较大了。一个互联网产品从大屏幕走到小屏幕,挑战在于什么?挑战是产品非常不适应,为什么?如果简单把一个PC网站搬到你手机上,我估计咱们都不会浏览,因为信息太多了,看不过来。
 
所以对移动互联网的产品特点来说,就得简单有效,一个屏幕不能放太多的广告,在PC互联网时代,上一个网站可以帮助十几个广告出来,但是在手机上做不到,用户看不过来,体验也非常差。所以这个时候,我们就更加投其所好,比如说一个用户只能放三个广告,放多了,用户看不过来,或者体验不好,假如说放三个广告,PC互联网网站可以放10个广告,你有什么理由从10个减掉3个,这10个里面,我哪7个要砍掉,你的理由和依据是什么?产品经理拍脑袋吗?还是老板拍脑袋?肯定不是这样的。这时候大数据就起到作用了。
 
我通过大数据了解到用户的兴趣爱好,我就知道可能那7个广告没有效果的。我只能放那3个,这就是大数据对企业的运营起到的很重要的作用。所以从这几个方面来看,互联网大数据很重要的特点,就是移动互联网本身的特性对互联网大数据很重要的一个影响。接下来我跟大家分享一下互联网大数据的一些应用。
 
我主要分享企业运营的应用,我总结了一个金字塔,大数据在企业运营里面的金字塔,基本上代表了很多互联网企业的应用场景。分为这么几层,最底层是数据平台,刚才我说了,做大数据肯定得先有数据,这一层面是解决数据质量的问题,这是第一个核心要点。很多企业数据质量非常不好,而且还有很多问题。比如说数据是孤岛,这两个是一个问题,是银行好,还是电信好?数据散落在企业不同的部门,数据不关联起来,价值比较低,数据资产不能很好的反映出来。
 
我跟人聊,他说我们企业也有做大数据的,你跟他交流一下,看有什么差异?我给他最大的启发,把数据当成无形资产管理,大数据是企业的无形资产,如果不重视数据的整合和数据质量的话,最后你这个企业要精细化运营的时候,数据就很难起到作用了。数据起到作用是这个企业增长放缓,或者行业增长放缓的时候,数据价值就起到更大的作用,老板那时候才重视数据,重视精细化运营,精细化的分析。经历过粗暴式运营,形成很多信息孤岛,一开始没有把数据整合在一起的话,后面的数据应用就非常困难了。
 
这里面会有什么建议呢?我看到很多传统行业数据是孤岛,银行、电信很多企业都有数据,包括医疗的数据孤岛。你通过规范把数据整合到一起吗?通过规范是非常难的。
 
比如说我碰到一些做医疗行业大数据的朋友,制定规范,上有政策,下有对策,最后整合的数据质量也非常差。所以解决这个问题最好是通过技术来解决。我们在360内部,前几年也碰到过这个问题,就是数据质量不是特别理想。后来我们用了一套技术方法,做了一套统计SDK的解决方案,只要用户们接入我数据SDK服务,这是一个技术解决方案,它的数据完全按照我的技术方案上报的,就不会存在数据质量的问题,这是一个。
 
还要解决另外一个问题,对于互联网企业来说,我们天天说用户,我要了解用户的兴趣爱好,我这一层要解决的是什么?我了解我的用户要达到像我了解家人一样了解它。我要做画像打标签。好的一个互联网企业,一个用户打上上万个标签,通过访问行为和使用行为了解他的爱好,这一层是很重要的。
 
做完底层以后,上面很多都是应用层,包括业务运营监控,通过大数据的优化用户体验,包括精准的运营和营销,这里面有很多相应的方法。包括在经营分析层面和战略分析层面可能有不同的应用。
 
业务运行监控,对于老板来说,他看数据,一般就是看大数,比如说收入多少,日活跃用户有多少,老板最关注的是什么?比较厉害的老板可能每天都看日报,或者比较注重数据的老板每天都会看日报,他会问今天的用户活跃度为什么下滑了。如果要通过人工的分析提数据,写报告这种方式是很慢的。一般的互联网企业,一般做出一套解决方案,根据他关注的KPI,我们做一个金字塔式的拆解。金字塔上面所有的数据每天都更新。如果顶上的数据有异动的话,我们可以通过计算机金字塔每天拆解,每天监控,计算机可以告诉我们,哪一点数据有问题。
 
对互联网产品来说,我们可以定位到用户活跃度,总的活跃度出问题了,通过这个里面,我就有可能知道,某一个模块有可能有BUG,或者某一个模块出现什么问题引起KPI下滑,这种产品是非常成熟的。
 
对于业务运营监控层,我们希望做出更多智能化的数据工具,就像360提出来的给用户做体检,我们给企业运营做体检,通过大数据每天都可以拿着“体温计”测,我就知道哪个环节有问题,传统的超过38.5度就发烧了,我们能不能做出类似的数据工具,可以让我们的运营人员通过大数据一下就知道哪个环节出问题了。
 
第二个场景,在精细化运营里面,用户生命周期管理,任何一个用户都是有生命周期,从一开始用你的产品到最后离开,时间短了可能半年,时间长了两年三年都可能会有。使用我们产品的时候,你能不能通过大数据手段实时知道它处于哪个状态。跟你的产品是热恋期、高风险还是流失期,到底属于哪个状态。
 
在互联网企业里面,我们可以通过大数据了解一些核心产品的用户属于哪个阶段。属于哪个阶段还不够,我们通过算法可以计算出来他们处于哪个阶段。比如说处于跟我产品的磨合期,也就是刚使用,对于很多产品来说,刚使用的最大的风险可能流失,这个月,或者过了三个月可能就不付钱了。我能不能通过数据识别的手段识别出来,他下个月可能不付钱。甚至通过数据挖掘出来,下个月可能会走的人,是什么原因要走。这里面全可以通过算法做自动化的分类,,给用户打上相应的标签。
 
如果用户使用我们产品的时候,我们就可以自动化的知道,假设说我有1亿用户,哪些用户处于哪个阶段。比如说两千万用户处于磨合期,这两千万磨合期用户都处于什么样的状态,兴趣爱好是什么样的?一下子就知道了。做的比较好的情况下,如果我知道,处于磨合期的时候,我可能可以通过系统,自动化的推送一些他感兴趣的活动,或者一些产品功能。
 
还有另外一种大数据作为产品的引擎。刚才我说到的这两个分别是导航仪的作用,我通过帮老板分析,帮企业经营分析,第二种是把数据嵌入到生产系统,可以知道他的方向。还有一个是发动机,作为业务的引擎。
 
我相信这种应用会越来越多,这是360的摄像头,智能摄像机,头像是我,因为上班很早,每天通过这个产品跟我们家小孩儿交流,我通过手机的摄像头可以看到小孩儿,他可以听见我的声音,我们可以进行互动。这个产品跟大数据有什么关系?
 
比如说这里面,我们最近开发出来的功能,一开始这个产品是没有这个功能的,门被打开的时候会报警,我们通过软件的方式让它有这个功能,通过大数据图像识别手段实现这个功能。我手机截一个图,家里们门窗打开了,这是阳台的窗户,我老爸晾衣服的时候,把阳台打开了,通过图像识别手段给我报警,我相信通过图像识别,越来越多的场景会产生,大数据对非结构化数据未来是非常常见的场景。
 
未来的机器人,指向智能化的话一定要通过大数据看得见的能力,因为机器看不见你,看不见前面有什么,看不见有什么样的交互,通过声音给他,这是浅层的需求,如果通过看得见的东西做交互和响应一定会更聪明。未来互联网大数据很重要的方向,通过图像识别的手段,让计算机更加聪明,更加知道我们身边机器环境是什么样的。收集完这些数据以后,再给机器人客户给到更好的反馈和体验,这是未来很重要的方向,这是更重要的,我认为这是产品引擎,我就讲这么多,谢谢各位!