杨琛:谢谢各位,今天非常的高兴有机会和大家分享一下爱奇艺的一些工作,我的标题是新媒体时代的大数据应用,区别于传统的媒体,大家来爱奇艺,更多的是认为网络视频,把原先在电视上播出的视频搬到了互联网,其实远远不止如此。我会给大家介绍一下我们到底是干的什么。
我用非常短的时间介绍一下爱奇艺。然后说一下爱奇艺的大数据应用,最后展望一下未来。这是我们爱奇艺的企业愿景,让人们平等便捷的获得更多,更好的视频,爱奇艺这么多的发展一直是在为了更多的用户提供更多更好的视频。
我们是在2010年的4月22日成立,这五年我们收获了很多,我们现在在PC端,日均覆盖都是第一,月度覆盖也是第一。我们还有一个非常让人骄傲的一个成绩,是在移动端的安装,已经超过了10亿,这个数字在整个互联网是非常的令人赞叹的。
还有一块我们在TV端的,根据我们内部后台的数据,我们在2月份的时候,我们的TV端的比重已经是到了一千万。我们看一下爱奇艺做的一些工作,爱奇艺有大量的数据,对于爱奇艺来说,很多的业务也是依赖于存储,最多的是视频的内容,爱奇艺存在这些内容的时候,也有很多延伸的相关的服务,一方面是搜索,还有大量的用户,同时还有电影票,爱奇艺的观影数据,还有一部分的社交。会做四个维度的分析,我们要采购内容,有了内部用户才可以观看这些重要的内容。
内容的选取对我们来说是非常的重要的,有了这些内容,我们可以对用户产生相关的分析,主要是为了给他们提供更好的服务,同时因为本身互联网视频的业务,相对也是要依赖于一部分的变现,所以我们也会做广告,维持和用户的粘度。还有一部分是人群的定向,这些都是大数据业务的一些延伸的应用。
爱奇艺的大数据主要是来自这几个维度,首先是多元化的服务,第一个维度是视频的维度的,依赖于很多相关的产品,比如是搜索推荐,很多的时候会涉及到一些连接,用户在什么终端上看,搜索一些什么关键字。还有一个维度,爱奇艺也会有一些现在其他的电商,包括电影票,还有游戏这一块的业务,这些都是以内容为核心的,所以相对来说的话,有这些业务也会对数据产生大大的补充。同时我们包括了PPC,我们有几百万的长视频的内容,相对的来说,这个量在整个视频行业来说是非常的大的。
同时我们也有海量的用户,每天到达爱奇艺的用户接近二千亿,在访问爱奇艺服务的同时,给我们提供了大量交互的数据,我们可以很好的探测到用户是不是喜欢这个内容,是不是不喜欢这个内容,用户到底喜欢怎么样的内容,喜欢在什么时间,什么终端上看怎么样的内容,这些都可以通过后台分析出来。它的立体相对于Volue是最重要的,不管是什么方面的增长,都会带来Volue的急速的增长。
爱奇艺本身在内容生命周期这一块做的工作,我这里画了一个内容的生命周期,每一个内容爱奇艺决定采购的时候,都会经历这么一个生命的周期,我们要决策到底是不是应该买这个内容,买了这个内容以后,我们就决定应该怎么样营销这个内容,营销是为了让用户知道,让品牌广告主知道,我们有这个内容,可以怎么样变现,同时吸引更多的用户来看,真正的到了运营期的时候,会把内容在终端上上线,让用户很好的享受生服务,然后会再次评估,说这个内容是不是适合爱奇艺的用户,到底是不是适合爱奇艺的平台,我们是不是值得把这个内容采买,总体我们采购这个版权的内容都是有时间的限制的。再次的评估也是非常的重要的。
我们下面做了一些相对应的产品,这个在行业里面做的工作都是类似的,爱奇艺做的比较前面一点,我们主要是做了二块的工作,一部分是VV的流程,VV是视频网站区别于传统的互联网门户不一样的地方,因为传统的互联网的们很多是看PV,UV,但是本身不和观影关联,这一块不能代表互联网的广告价值,所以VV是更重要的指标,在内容还没有上线的时候,我们就要预测这一块的内容有怎么样的表现。
还有一块是电影,作为传统的电视剧,电影,动漫,电影在这里面是非常的特殊的,电影也是一个非常庞大的产业,很多的时候,电影相关的指数对我们的运营,采购非常的重要,对于运营营销,我们主要是会做二块,一块是品牌的更新,哪一些品牌的广告主会对这一块的内容感兴趣,会和后续的品牌广告主之间,做一些探讨。同时会做一些目标受众的分析,告诉广告主,这些用户的特征是什么,让我们的变现,让我们的用户的体验会变的更好。
运营的层面这一方面的产品更多一点,我们推出了第一个针对用户的产品绿镜,传统的媒体做食品播放的时候,是在固定的时间,固定的频道放,并没有任何的交互,同时终端的本身是单向的,不能贡献任何的数据,但是互联网不一样,用户喜欢这个数据,你就可以点开这个视频,并且可以观看,看到了喜欢的部分,一定会拉回去看,不喜欢的部分就会往前看,我们做了一些相关的分析,在统计的意义上,超过一定的预值的时候,这一部分的表现是非常的稳定的,所以我们做了绿镜这个产品,可以让你在很短的时间里, 可以看到自己感兴趣的东西,这个就是互联网带来的一些比较有意思的创新。
同时我们针对用户在爱奇艺上的行为,做了爱奇艺指数,还有一块是新媒体时刻也是比较重要的,传统的内容发现,很多的时候是用户需要去记到底是什么时间,在什么电视台播什么节目,对他们的检索是非常的不方便的,新媒体的话,就非常的简单了,一方面是视频的推荐,推荐是对于很多的人来说,来了以后不知道要看什么,但是根据观影的记录,可以知道什么片子是比较类似的,可以带来很好的点击率,同时还可以发现和他类似的人看了一些什么相关的内容,所以对于提升用户的体验,大大的降低了成本。
还有一个很多的人是知道自己想要什么,所以搜索是很好的入口,爱奇艺的搜索,除了传统的可以更好的检索,还做了一个很好的意图识别,比如是可以输入最近好看的韩剧,就会进行搜索了。爱奇艺也在做相关的工作,还有一块的话,属于我们目前视频网站最大的特色,传统的做大数据的时候,都是依赖于做文本,或者是节奏化相关的挖掘,或者是文本里面做相关的挖掘,视频网站来说,拥有海量的数据并不是结构化的数据,也不是文本的数据,而是大量的视频。感谢计算技术的发展,计算机技术飞速的发展,利用这些新的技术,可以做一些以前不能做的事情,我们可以理解视频里面存在一些什么物体,我们可以做各种有意思的创新性的产品。
同时我们还可以识别里面的人,关于内容评估这一块,我们会对很多的维度的内容做全方面的分析,分析到底带来了多少的广告的价值,带来了多少的会员的价值,可以很好的评估这一部分的价值。下面介绍一下VV预测这一块,本身VV预测这一块并不是每一个公司都可以做,也是二年以前和谷歌发布的文章有关。在爱奇艺成立之初就非常的重视对数据的投入,这个也是我们CEO的一个梦想。
二年以前我们把这个系统做好了。主要的就是凭借着爱奇艺多年的运营数据,因为爱奇艺运营到现在的时间也比较久了,有大量的运营的数据,在运营的过程中,也产生了大量的关于视频的数据,同时我们对内容和用户做了相关的剖析。还有一个非常重要的,我们做了很多在控制条件下的实验,对我们的平台有怎么样的内容会更准确。
第一个是2014年非常火的日播剧,可以看到这这个结果里面体现了二个不一样的东西,一个是日播剧的分布,后面二个是周播剧的分布,可以看到预测和实际的情况非常的不同。第二个是去年春节的时候非常火的《来自星星的你》,预测和真实的情况会发生很大的偏差,主要是因为发生了韩国的沉船的事件,那同时的话,爱奇艺这里本身的运营上的一些侧重点的改变,做了这个数据的下降。这个也给了我们很好的启示,我们可以分析一下到底我们的运营好不好,根据这些预测要求我们的运营,到底应该怎么样的运营,应该怎么样推这样子的事情,以达到更好的效果。
这一块是前面说到的我们目前来说非常的有特色的两个产品,一个是闪植,很多的传统是把拍摄放到内容中,到底好不好,植入方也不知道,我们的这个技术弥补了传统的植入,在拍摄的初期就要介入的弊端,同时还可以规避视频不叫座,植入花了很多的钱,目前在我们爱奇艺也有很好的表现。
还有一块是随时购,通过我们的后台本身对视频做很多的识别,我们会识别视频里面存在相关的商品,把这些商品在播放的时候,同时就在旁边展现出来,根据我们的实验,这个效果是非常高的比一般的高二三倍。这个是爱奇艺的fiigure-Out,可以识别视频里的演员,首先是会做人脸的检测,做人脸的定位,然后做特征的提取,提取好了以后,就会到后台的数据库和明星进行定位,在用真正的播放的时候,就会展现和明星相关的品牌的广告,从这个角度来说,可以更好的促成变现。
这一块是内部和内容相关的,其实爱奇艺目前做的很多的事情,在用户体验和商业的价值之间做权衡,所以需要尽量的多为用户考虑,我们在今年的年初上线了第一个全中文个性化的影院,机遇GBDT个性化的预测,有大量的主题,从效果来看,CTR提高了100%的效果。适合18-25岁的人观看,但是要机器组合成这样子的主题,相对来说还是比较困难的。
还有一块是竞争广告。这一块的话有三个有意思的产品,一个是一搜索百映,依赖于我们和百度的合作,群英荟也是观看时候的一些位置的信息,同时根据性别的定向众里寻TA。
爱奇艺在大数据重构新媒体的未来。怎么样用好大数据,怎么样更好的发展我们的大数据,我们也相信大数据正在重构新媒体的未来,同时今天也非常的高兴,今天能够在这里和大家聊一下,爱奇艺非常希望和业界的同仁一起合作,希望可以把爱奇艺做的更好,谢谢大家!
8月30日,由七牛公司主办的主题为“数据重构未来”的“七牛·数据时代峰会”在上海国际时尚中心继续举行。爱奇艺首席架构师杨琛从爱奇艺的角度分享了新媒体时代的大数据应用,以下为现场实录: