《纸牌屋》你学不会 Netflix大数据之秘密武器

伏昕 发表于:13年08月06日 09:39 [转载] 中国企业家网

  • 分享:
[导读]凭借一部片子咸鱼翻身,这样的桥段在当下热播美剧《纸牌屋》身上重演,反转剧主角是美国一家视频公司Netflix,它的武器则是大数据。

凭借一部片子咸鱼翻身,这样的桥段在当下热播美剧《纸牌屋》身上重演,反转剧主角是美国一家视频公司Netflix,它的武器则是大数据。

首次进军原创剧就走红,Netflix不仅成为娱乐圈里的谈资,亦成为数据革命的代表。无论是《纽约时报》、《洛杉矶时报》还是最近一期的《经济学人》,严肃媒体们都在重要版面研究《纸牌屋》成功之道。获得如此密集关注,并非没有道理。《纸牌屋》不仅是Netflix网站上有史以来观看量最高的剧集,也在美国及40多个国家大热。Netflix产品创新副总裁托德·耶林(ToddYelin)称,其表现甚至“比我们最大胆的梦想都要好”。

事实是,美国“白宫甄嬛传”、导演大卫·芬奇(DavidFincher)和老戏骨凯文·史派西(KevinSpacey),这些噱头只是用以吸引眼球的皮毛。最抓人的是,Netflix根据数据技术推导出《纸牌屋》的关键要素,喜欢BBC剧、大卫·芬奇和凯文·史派西的用户存在交集,这是多么酷的一件事。

中国的乐视网一直关注Netflix的发展路径。“值得研究的是Netflix如何从后端数据推导出前台生产。”乐视网副总裁何凤云说。这种做法与旧传统是背道而驰的,以美国著名的有线电视网络媒体公司HBO为例,它对导演强烈的个性抱以完全的信任,全权委任导演去制片、编剧、挑选演员。而在中国,几大视频网站在自制剧时都有自己的选片团队,由他们为观众选择与确定导演,挑选剧本。

多年前,依赖于种种技术,Netflix对数据的记忆能力已经炉火纯青。当一位用户通过浏览器登录Netflix账号,Netflix后台技术将用户位置数据、设备数据悄悄地记录下来。这些记忆代码还包括用户收看过程中所做的收藏、推荐到社交网络等动作。在Netflix看来,暂停、回放、快进、停止等动作都是一个行为,每天用户在Netflix上将产生高达3000多万个行为,此外Netflix的订阅用户每天还会给出400万个评分,300万次搜索请求,询问剧集播放时间和设备。没错,这些都被Netflix转化成代码,当作内容生产的元素记录下来。其首席内容官泰德表示,所有这些数据意味着,Netflix公司已经拥有“可寻址的观众”。

早年间,Netflix利用上述数据提供一项推荐引擎业务。比如说,数千万用户能在一个个性化网页上对影片做出1-5的评级,这些评级构成了一个巨大数据池,如今这个数据池容量已超过近百亿条。根据数据池,Netflix使用推荐算法来识别具有相似品味的观众,然后对这一群体做出相关内容的精准推荐。

Netflix要将巨大的数据池变为生产力并非易事。长年以来,为了提高算法精准,它持续地举办大型比赛,来提高自己的数据挖掘能力。2005年底,Netflix曾开放一数据集,并设立百万美元的奖金(netflixprize),征集能够使其推荐系统性能上升10%的推荐算法和架构。这个数据集包含了超过48万个匿名用户对大约近2万部电影做的大约10亿次评分。

Netflix一直在寻找与自身匹配的数据挖掘工具。据一位前Netflix云数据库架构师的博客回忆,在2010年Netflix完成了两次迁移,其一是将Netflix的数据中心迁移到了AmazonAWS之中,其二是将Oracle数据库迁移至SimpleDB。而到了2011年又从SimpleDB迁移到Cassandra,利用Cassandra提供的路由配置,集群可以被部署在多个大洲。忘掉上述专业术语,一个小故事足以说明它们的意义。法国电影《不要告诉任何人》在美国的票房收入惨淡,只有600万美元。可Netflix的工程师并不相信这个数字,他们通过上述数据挖掘技术,找到了不易察觉的点击量,而这些才是被隐藏的事实。2011年时,Netflix决定播放《不要告诉任何人》。如Netflix预测的一样,这部电影在播放后立即在最受瞩目的节目中排到第四位。

然而,投资人并不看好Netflix的这些努力。投资人表面上相信Netflix的数据库是个大宝藏,但财务报表的数据呢?去年万圣节,Netflix董事长兼CEO里德·哈斯廷斯接到一位投资人电话,后者告知哈斯廷斯,他将从二级市场收购Netflix10%的股份。投资人坚持认为Netflix气数已尽,这位投资人的计划是,进入Netflix董事会再建议哈斯廷斯卖掉Netflix。

早期,Netflix是北美家喻户晓的在线影片租赁提供商,它的主营业务是通过邮寄方式租赁DVD的模式赚取利润。然而,在互联网时代这个盈利模式逐渐式微。于是,Netflix将主营转向在线流媒体播放,其商业模式是付费用户通过PC、TV及iPad、iPhone收看电影、电视节目。但在逐步放弃高利润率的DVD业务,彻底转型低利润率的流媒体业务后,Netflix却遭遇营收增速放缓、成本费用激增的困境。2012年第三季度,尽管财报中营收和每股收益均超出分析师预期,股价却依然暴跌。美国知名专栏作家撰文称“Netflix被收购或许才是投资者最理想的选择”。

里德·哈斯廷斯别无选择。他决定反击投资人的短视,用事实告诉资本市场,数据不是花架子,而是地道的生产力。Netflix利用数据挖掘能力计算出可以赢的办法,1亿美元买下一部早在1990年就播出的BBC电视剧《纸牌屋》的版权,请来导演大卫·芬奇(DavidFincher),并由老戏骨凯文·史派西(KevinSpacey)担当男主角。

乐视网副总裁何凤云向本刊介绍,1亿美元买下的《纸牌屋》总共2季26集,计算下来单集成本约为400万美元,远远高于美国一般电视剧的单集制作成本——150万至200万美元,也只有《广告狂人》、《斯巴达克斯》这类热播美剧才能达到200万美元左右。算下来,对于Netflix而言,只有新增100万一年期合约付费用户才能收回上述成本。

Netflix并非没有计算过豪赌的回报,这样做不仅可以带来新增用户,更为重要的是它为Netflix开拓了上游市场,走上了自制剧之路。在《纸牌屋》之后,还将有四部自制剧在2013年登陆Netflix。这意味着,Netflix可以逐步降低对版权费用日趋高涨的好莱坞剧的依赖。

Netflix的故事,对于中国视频网站而言着实励志。他们与Netflix所面临的境遇相似:在美国国内,好莱坞的独家授权费用越来越高,版权成本上升导致资本开支加大。同时内容竞争越来越激烈,尽管在流媒体播放领域Netflix仍占据市场首位,但面临着HBO(美国家庭电视广播网)、Amazon(亚马逊)、Hulu、YouTube的竞争,它们都在加大内容投入。

由于版权价格提升,国内知名的视频网站们,诸如优酷土豆、搜狐视频、乐视网、爱奇艺近两年也纷纷打造自制剧。

据乐视网高级副总裁高飞对本刊透露,虽然去年上半年版权价格曾达冰点,但是现在又很快回升,从一线卫视购买电视剧,平均购买价格每集几十万,意味着买下一整部剧不下千万。在此局面下,拿下《纸牌屋》中国地区的互联网独家播放权的搜狐视频,不得不上调版权采购预算,其2012年的版权采购成本为5000万美元,但2013年这一预算上调到8000万美元。“但我们拍一个自制剧,成本基本上也就三分之一,甚至不到这个数。”高飞说。

关键是如何制作自制剧?国内视频网站意识到数据的重要性,也积累了大量数据。比如乐视网通过分析用户收看时间,在今年推出午间自制剧场。“但真正细致到使用数据来决定导演、演员,中国还没有哪家公司敢说他们能做到这点。”何凤云说。

此外,即便是有了数据,中国的流媒体公司还不敢像Netflix那样将宝押在一部剧上,因为中国的付费市场尚未成熟,目前还主要依赖广告盈利,无法完全将用户需求作为中心。“Netflix选择了这个项目,投巨资去做,就是博一个必须赢。”乐视网高级副总裁高飞对《中国企业家》说,“期待中国市场也可以通过付费收视足以覆盖成本,但这要寄希望于未来大屏电视以及电视平台产品和服务的成熟,以及付费市场的快速成长。”

除此以外,一位视频行业的人士指出,在中国基于用户数据做出分析的同时,还要考虑广电审核的要素,一些领域与题材类型都要稍微收拢,“不是没法依赖数据,而是不能完全依赖数据,我们选择数据时也一定要结合中国国情。”

[责任编辑:李晓菲]
戴尔高峰论坛将于2013年8月27~29日在北京国家会议中心隆重开幕,DOIT和易会将对DELL的这一年度盛会进行持续关注和报道。
官方微信
weixin
精彩专题更多
存储风云榜”是由DOIT传媒主办的年度大型活动。回顾2014年,存储作为IT系统架构中最基础的元素,已经成为了推动信息产业发展的核心动力,存储产业的发展迈向成熟,数据经济的概念顺势而为的提出。
华为OceanStor V3系列存储系统是面向企业级应用的新一代统一存储产品。在功能、性能、效率、可靠性和易用性上都达到业界领先水平,很好的满足了大型数据库OLTP/OLAP、文件共享、云计算等各种应用下的数据存储需求。
联想携ThinkServer+System+七大行业解决方案惊艳第十六届高交会
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技术有限公司 版权所有.