七牛数据时代峰会晚场—数据健康度现场大PK:中通服

8月29日晚,由七牛公司主办的主题为“数据重构未来”的“七牛·数据时代峰会”在上海国际时尚中心继续举行。会议有幸请到了不同阶段创业者们,通过与四位专家评委之间面对面的交流,对企业数据健康度进行现场诊断。以下为现场对话实录:  
 

 
        中通服辛炜博:谢谢各位,我相信七分钟之内可以把我的说完,首先介绍一下我自己,我是来自中通服的辛炜博。我们的业务我定义为互联网的底层世界。之前我们说的都是一些应用层面的东西。我们所做的是偏底层的东西。我们团队之前有个愿景,移动互联网是个美好的世界,我们希望每个人都能感同身受。为什么说这句话呢?我简单介绍一下我们的团队。18个月之前,我们这个团队国资背景下,相当于独资运营了。18个月之后,我们服务提供十个省,为两千两百万用户提供服务。我们非常关注移动互联网,我们非常关注数据。
 
        这张图可以简单的说明一下,在整个移动互联网分发当中,我们碰到的一些主要的节点。任何内容通过骨干网,最后通过运营商的接入。这个是所有的移动运营商的痛点,体验不可控,带宽不可控。所以正是基于这一点,我们做移动互联网的体验。70%这个数字是通过我们十个省的部署情况统计出来的。我们发现用户体验,移动互联网用户体验,70%是来自于移动接入。
 
        这张图是我们举的简单例子,我们能达到的用户。比如某一个用户24点在上海看了一个视频,这个视频253兆,53分钟,这个用户看到第三分钟的时候,停顿了一下,用户就放弃了这个视频。这个是我们的核心数据。这个案例我是举一个简单的例子。我们是再一个节点,在青海上西宁有一个节点,通过这个结点,相当于对于全中国的数据接入做一个扫描。三角形越大是网络回路试验。在整个中国传输网络当中,并不能距离越远的地方传输时间越长。造成这个问题的原因很多。我们通过这一点,可以发现我们的客户到底在哪里。
 
        我们是如何实现这一点的呢?首先第一点要发现目标,我们会对所有的数据库里面目标的访问做一个体验的标签,这个目标可以是一个智能终端,也可以是一个真实的用户。在这个里面,他们有什么样的共性特征。他们是属于哪个网的客户,实际上我们把这些体验的问题做一些汇聚。可能这些IDC的厂商,就是我们的客户,包括CDN的客户。第三点我们要确认一下,对于这个客户而言,我们为这个客户提供的最大价值是什么。我们是能为他们提供降低成本还是内容体验。最后通过我们的分析,来做到合适的用户推荐。
 
        这是一张简单的,目前简单的客户的分布图,除了一些CDN,像视频、音乐、游戏,新闻类的CP都是我们一些潜在的目标群。我们能为他们带来的价值,我简单谢了一下,主要是集中两点,一个是提高移动互联网的分发体验,第二个是减少流量分发的成本。对于我们大数据而言,我们简单说一下,我们整个考核的思路就两个原则,第一个我们所有的数据跑出来之后,能否给最终用户带来实际的价值,第二个客户为此付出的代价是否值得。80%的数据来自外部。就是日志类的数据,10%是来自KPI,和KPI的一些统计。另外8%-10%是来自KPIN(音)。KPI是指标方向。主要是我们给客户带来的体验方面。我们会对某个CP的网站做一个健康检查,比如它里面有很多冗余数据,经过我们的处理之后,我们可以提高用户访问体验,这个概率可能是80%以上。这个是我们的目标用户。第二点,流量体验,带宽,这个是我们的一些参考值,还有一些非常重要的指标,投资回报率。这个投资回报率一块是我们自己的,一块是为我们客户所做的测算。我们目前是十个人左右的小团队,我们基本上分三块,数据清洗、处理,大概四个人左右。然后我们会交我们的第二部分,数据运营团队,他们会对不同的客户做一些数据模型设计,最终交给最终团队支持销售。
 
        最后一句话,其实对于我们这样的传统企业,大数据对于我们的改变是非常大的,因为我们用大数据之前,我们是用非常传统的方法,统计等方法做一些简单的模型测算,有了大数据之后,我们发现我们的客户群变多了。我们客户群从运营商开始,一直到互联网的厂商,都是我们的客户群。所以一句话我总结一下,网上有个小故事,说一个男人最努力的时候是在他最没有能力的年纪,遇到了他最想照顾一生的姑娘。所以希望每位在移动互联网时代不要有这样的无力感。第二我们希望把分发环节的成本降下来。因为这些成本最终会落到每位用体头上。谢谢。
 
        吕桂华:我有一个问题,你们怎么得出真实使用情况下的使用数据的。因为如果你们买点的话,只是少量的点。
 
        辛炜博:我们是这样解决的,首先我们在,区域性的位置,比如我不知在青海,青海所有的数据都是经过我的。我们会在这个区域,上下行的评估信息。所以我们刚刚为什么说我们覆盖的范围是全国十个省左右。我们地域性非常强。其他的省做一些采样数据。这个可能就跟大数据的量级没法比拟了。
 
        评委:我终于看到一个企业级的大数据企业了。我所在的公司也正好在做大数据的一些分析。我觉得这个案例的话,本身它的KPI是非常明显的,大家都会想到响应速度、用户体验,回报率。听起来这一套方法不是自动化的过程,因为你可以想,虽然你讲到最后一公里,经过调查问卷,有最后一公里,有没有知道解决最后一公里是非常复杂的,因为背后还有路由器、网关、计费系统。这个数据搜集到解决问题,这个可以规模化吗?
 
        辛炜博:正像您所说的我们手上有很多的网络数据,实际上我们现在还没有实现真正意义上大数据的全自动化,或者我们马上可以把策略想出来。我们现在做到的只能是第一步,策略做出来,实时的生效。就是用户上下行的时候,我们三秒之内可以做一些数据变更。策略执行这一块是下一步的方向。下一步想请各位大数据专家给我们一些建议。
 
        评委:你们现在的核心KPI,能问一下您对您客户的好处,是否也用数字来衡量。
 
        辛炜博:对的,这个是一定的。因为比如我们现在跟IDC,我跟他们接触之前,我会对他们做预评估,帮助他们托管的IDC用户做一些全面的评估。因为大家知道会有一些冗余的流量。这些成本是由最终用户来承担的。所以我会告诉他们,我能给你带来什么样的价值。要么提高他带宽的效果,要么是带给他增值的空间,我会告诉他根据他现有规模的盈利预期。下一步试用。这个过程当中,我会把我们KPI一步步的,比如两个G的流量,十个G的流量,逐步评估目标。最后到回报这一块稍微复杂一点。
 
        评委:这个过程是自动的吗?
 
        辛炜博:目前还在分阶段的做。
 
        评委:谢谢。