IBM大数据分析技术让腾讯世界杯报道与众不同

在巴西世界杯的一个月时间里,IBM中国研究院信息分析研究部研发总监苏中熬了不少夜,但是他没有看过一场比赛。有人发帖子说,“别人在看球,我们在看看球的人。”苏中转发了其中一条,评论说,“我在看那些看看球的人的人。”好像有点拗口,所谓看球的人,就是球迷;看看球的人的人,就是媒体的记者、编辑们,他们关注球迷的喜怒哀乐;苏中看的则是媒体的记者、编辑们,帮他们更好地了解球迷的所思、所想,强化报道内容对受众的粘性。

为了突破传统的体育比赛报道模式,挖掘球迷的真实需求,创造独特的报道视角,腾讯在本届世界杯比赛报道中利用IBM的社交大数据分析和云计算技术针对社交网络上球迷关于世界杯的广泛评论、观点、声音进行实时分析,并获得对球迷关注话题、球迷性格特点、球迷独特观点的实时掌握,从而让球迷在腾讯网上享受到一场与众不同的“足球报道盛宴”。苏中在IBM中国研究院负责大数据分析。世界杯期间,苏中和他的团队与腾讯一起,抓取社交媒体中的海量数据,来支持腾讯对世界杯的报道。

IBM与腾讯带来世界杯“新体验”

社交网络改变了世界杯的观赛模式,对于网友和球迷来说,这届世界杯堪称一场“指尖上的世界杯”,微博、朋友圈等社交网络成为球迷吐槽、评论和互动的阵地,产生了大量的数据:一场比赛获得了1640万次讨论;15天时间累计达10亿次转发——海量的数据中蕴藏着大量有价值的信息和商机,也成为大数据技术的练兵场。

在世界杯开赛之前,IBM和腾讯“牵手”成为腾讯体育社交媒体数据分析合作伙伴。IBM根据网友和球迷在腾讯网络媒体平台及社交网络上发布的海量公开信息和数据,通过大数据分析技术,获得球迷话题、球迷类型、球迷个性分析等一系列洞察;同时还能根据这些信息得出网友心中真实的球队支持率。而腾讯则通过这些分析得出的洞察来指导内容报道,细分受众,制作球迷更加喜欢的内容。

1、实时获取最真实的球迷对球队的支持率

说起球迷支持率可谓是漫天飞舞,无论是不同媒体还是各类组织都在发起关于比赛的预测与投票,但这种带有倾向性的调研是否真能体现球迷的心声呢?

在传统的赛事报道当中,支持率一般用投票来获得,比如某一个网站推出阿根廷对阵德国,球迷支持哪个球队,就可以投谁的票。这个投票数有时会达到10万量级以上,貌似很客观了。但其实,这样得出的支持率数据是个主观的数据,如果哪支球队的球迷比较热情的话,他们可能扑上去点,使劲投票,所以,得出的支持率也不一定是球迷内心真正的想法。

IBM则是在社交网络上和微博上抓取球迷的声音,通过自然语义分析,来获得球迷内心最真实的想法。

很有意思的一个分析结果是,在7月7日,世界杯还未进入半决赛阶段,IBM通过大数据分析得出的结论已经是这样的:中国球迷对四强的支持率是——德国第一,阿根廷第二,荷兰第三,巴西第四。这是根据6月15日到7月7日这段时间中国球迷对所有的球队的支持数据累计分析出来的。虽然没有投票,但每一个球迷的观点都已经被听到,都已经被展现,这才是中国球迷真正的声音。

2、你的那个熬夜看球的朋友,他是怎样的性格?

在世界杯观赛期间,同为一个球队、一名球星的粉丝,拉近了球迷与球迷的距离。就算你不是球迷,你从你熬夜看球的朋友钟情于哪支球队、哪个球星,也可以知道他(她)的性格。

IBM中国研究院信息分析研究部研发总监苏中

苏中介绍说:在大数据和球迷碰撞的过程当中,可以看到每一个球迷都有他自己背后的性格,而这背后的性格实际上是跟他喜欢的球员的性格非常相符,跟球员的表现也非常相符。我们知道,喜欢一个人、爱一个人不是无缘无故的,是什么样的原因让这个球员拥有了中国的球迷?有可能是技术、性格、人的魅力、英俊的外表……,IBM运用认知心理学的理论,通过大数据情感挖据的技术,分析、解读了每一个球迷背后的特性。比如,梅西的球迷是低调、敏感、有条理性的,宅男宅女居多;C罗的球迷则不乏女王范、有气场、爱热闹;咬人的苏亚雷斯也有自己的粉丝,在社交媒体上在某个时间段内苏亚雷斯占据了整壁江山。他的粉丝属于低条例性,但是有想象力,敢于竞争,有自我。本届世界杯踢进第一个乌龙球的巴西队员马赛洛,他也因为踢进乌龙球之后的天然呆萌的表情,引起了中国球迷的怜爱,大家不但不怪他,他的女粉丝所占的比例突然涨到了73.81%。

这些都是很有意思的事,腾讯将这些性格分析的结果融入赛事报道中,给了球迷们与众不同的观赛体验。

3、热词挖掘帮媒体聚焦球迷真正感兴趣的话题

感觉媒体的解读缺乏深度?感觉专家的点评不靠谱?感觉已经吐槽无力?但在今年腾讯的世界杯报道中球迷们会发现不少意外的“惊喜”,惊喜于独特的观点,惊喜于与自己相同的视角。这些都是从哪里来的?这就是IBM社交大数据分析的能力,它通过对球迷关注热词、热点话题、关联话题的分析,可以让编辑实时掌握球迷关注方向,并在报道的第一时间制作有针对性的内容,让媒体报道在当前这个信息爆炸的新互联网时代下重拾及时、深刻、独特视角的特点,让球迷不仅仅作为受众,更被融入到话题创作过程中。

例如,在八分之一决赛的时候,IBM的社交数据抓到的一个最热的词——门神。有的球迷说,每场比赛不用看前90分钟了,直接看最后的点球大战就可以了。诺伊尔是门将兼后卫一肩挑,墨西哥、尼日利亚和阿尔及利亚的三位门神也特别震撼。IBM从数据中看到球迷对门将的关注度已经超过了前锋,甚至超过了大牌球星,超过了球迷对他们本队的关注度。甚至可以总结说:当今足坛的战略走向已经从进攻型到防守型,谁能够把门守得住,谁就能获得最终胜利。尖刀已经不尖了,但是盾越来越厚。

还有,在西班牙出局之后,IBM通过社交数据抓取到了“皮箱登场”这个热词。因为上一届的卫冕冠军是要护送大力神杯一直到这一届的比赛决赛的时候,送给这一届的冠军。虽然西班牙已经出局,但是他的队长还要悲催地拎着装有大力神杯的皮箱一直看着别的球队在战场上厮杀到最后,悲悲惨惨地交给现任的冠军。

IBM对社交数据的挖掘,在腾讯的世界杯报道中发挥了锦上添花的作用。

为深度挖掘社交平台上形式丰富的非结构化信息,提取有指导意义的洞察,IBM构建了IBM社交大数据分析解决方案系统,利用机器自学习方法和自然语言分析技术,倾听网民“心声”。

﹒命名实体识别:在处理非结构化数据时,不管球迷通过任何设备录入信息,都有一些文字没有标点符号,不同的短语在中文里有着不同的含义,需要IBM利用技术把人名、球队名等识别出来,以便进一步的分析。

﹒话题检测:该技术帮助识别网友讨论的话题。

﹒语义情感分析:在理解球迷讨论的话题后,利用该技术可以判断球迷的立场是支持还是否定,从而获得球迷情感上的倾向。

﹒网络关系抽取:社交平台上聚集了众多球迷,讨论各种类型的话题,利用网络关系抽取技术,对出球迷集中讨论的众多话题进行综合分析,IBM将话题间真正有价值、有分析意义的内容关联出来。

在以上四大核心技术的基础上,通过对社交数据进行分析,得出结论,腾讯在相关赛事的报道上通过风格和内容的调整,使报道更丰富,更加贴近读者。

SoftLayer为大数据提供强大支持

在分析工作的背后,海量的数据是得出精准洞察的基础。根据体育赛事特点,所有数据会以比赛时间为聚集点,爆炸性的涌现。这需要一个高度稳定,并极具扩展性的基础架构平台来支撑。这次,IBM将社交大数据分析平台放到了刚刚开放开始提供给对外服务的IBM SoftLayer香港数据中心的公有云平台上。IBM大中华区全球信息服务部云计算服务总经理余忠宁介绍说:数据量的不确定性对计算资源的弹性要求很高,能够快速部署的云计算才能给予最好的支持。因此,大数据往往和云计算自然而然的连在一起。数据量激增时,SoftLayer云计算平台快速部署服务器,调配更多的计算资源和存储设备来支持系统正常运行。在数据量降低时,可以通过释放计算资源,节约成本。

SoftLayer提供随需应变的云基础架构,其中包括物理裸机服务、虚拟服务器、存储器以及网络,它们都在一个平台上,客户完全可以进行访问和控制。这些企业级组件能够让企业创建他们所需要的公有云、私有云或者混合云等基础架构环境,用来支持企业最苛刻的应用和负载。实现这些独特能力的关键途经之一是SoftLayer在世界各地以统一的、标准化的方式建立数据中心。每座数据中心都能够提供相同的全自动化的服务组合,并拥有将所有数据中心连接到一起的专有、安全的网络。

这次IBM把社交大数据分析平台部署在SoftLayer这个云计算环境里头,实时把分析结果推送到腾讯的世界杯网站上,帮腾讯的编辑人员实现实时的话题把控。

IBM大中华区全球信息服务部云计算服务总经理余忠宁

IBM大中华区全球咨询服务部高级经理郭树勇

IBM大数据分析技术与体育赛事的合作才刚刚开始,在其他行业,IBM很早就开始进行多方面的尝试。IBM大中华区全球咨询服务部高级经理郭树勇介绍了IBM大数据分析技术在其他领域的应用。例如帮助快消企业快速了解市场对产品的反馈,通过快速评估为市场策略调整提供依据。和以往的市场调查相比,社交大数据分析反馈更快,更为灵活。目前,IBM已经帮助领先的快消企业倾听社交媒体的声音,获得产品、服务、竞争对手和市场方面的反馈,更好的实现与消费者的互动,真正为产品生产、设计、包装等各部门提供实际有效的建议。未来IBM社交大数据分析技术也将开发出更多针对行业领域的应用,帮助企业和行业更好的从大数据中获取价值。

资料:

IBM与体育同行

对体育行业不懈支持,是IBM几十年来一贯的做法。早在1960年,IBM就为美国斯阔谷冬奥会提供了第一台电子数据处理系统。在之后的40年中,IBM一直是奥运会IT赞助商,为每一届奥运会提供综合信息服务。在1996年亚特兰大奥运会和2000年悉尼奥运会,IBM还跻身TOP赞助商行列。在2000年悉尼奥运会上,IBM搭建了奥运资讯检索系统、奥运竞赛结果系统及奥运管理系统,帮助奥运参与人员及时、准确地获取赛事信息,将成绩即时分送给计分板以及全球的媒体并妥善地安排奥运参与人员。

在其他职业体育赛事中,IBM提供了丰富的结果和比赛管理系统,从而进一步拓展了在此领域的赞助和商业解决方案。1968年,IBM为美国网球公开赛提供了虚拟化技术,以提高系统利用率并降低能耗。之后,IBM帮助网球四大满贯主办方搭建官方网站并提供私有云服务,以承载上亿次的点击率并平稳运行,独创的千里眼技术(Secondsight)、IBM SlamTracker、专门为网球赛事开发的3D体验设计以及专属智能手机应用开发极大地提升了观众体验。在2013年的美国高尔夫大师赛上,IBM利用创新数字科技使球迷可以通过App、移动网站和手机等8种渠道观看现场比赛视频,实时获知比分并收看精彩瞬间。

在刚刚结束的温布尔登网球公开赛上,IBM的科技为公开赛的组织者、媒体和球迷提供了包括技术统计数字、比分和发球时速在内的各种有关信息,球迷还可以通过官方网站实时观看从比赛现场传送的每一场比赛,每一次得分的情况。

一直以来,IBM都在以先进的科技,助力各大体育赛事主办方为球迷提供深入及时的观赛体验、用数据分析提供一流的战略帮助运动员与教练提升技术水平,并推动整个体育行业的快速发展。不仅如此,以数据为代表的新科技也正在改变这个世界。无论从赛场到商场,还是从个人到社会,我们都可以感受到以数据为代表的科技之美。