“大数据”——为旅游业带来无限可能

如果你是Tnooz的忠实读者,你肯定看到过关于大数据(Big Data)的潜力之类的文章。

但就像大多数不断涌现的技术一样,人们很困惑它真正意味着什么,它能够带来更好的客户体验,提升销售吗?

这篇文章只是抛砖引玉,分析了大数据未来在旅游业一些潜在的应用:

大数据

“大数据”这个词通常有几种表达方式,其意义不言而喻。“大数据”意为大量的数据,即在规模、工作量和总体成本方面都超越了普通数据库的数据集,以及提取分析其中含义的技术。

那么我们会在旅游业哪些地方遇见大量的数据呢?

其中一个最好的例子就是在线旅行社的分析日志。多年来,分析工具让旅游企业追踪转化率渠道、详细的消费者数据及其他相关信息,如哪些页面的转化率最高?哪些页面的蹦失率最高等等。

然后这些分析报告被用于优化网站以确保最高的转化率。但在大数据的时代,旅游企业在收集并关注的数据比以往任何时候都多。

例如,某些网站还实时收集访客具体的鼠标页面活动信息。

针对每位用户自然生成了很多信息,使得旅游企业对于每位用户在页面上的行为有着独到的理解。

在几年前,要完成这样的数据储存量甚至比登天还难(因为非常昂贵)。

如今,廉价的储存方式逐渐流行起来,分布的文件系统使得数据可以在几十甚至几百台电脑之间共享,因此实现了廉价有效的数据储存。

随着储存技术的提高,储存每个字节数据的成本将继续下降。

大数据分析、MapReduce以及语义提取

拥有所有的数据固然很好,但是真正的价值依赖于语义提取功能。基于Google最初发明的技术,大数据工具如MapReduce能轻易发现数据中的共同趋势,以及与这些趋势相对应的行为。

举个例子让大家更容易理解:

想象一下,你有一份包含全世界所有酒店的Excel表格,你想从中发现那些被描述为“很棒!”的酒店。

原始数据看起来也许如下图:

酒店名称——描述

—————————–

A酒店 “糟糕的体验”

B酒店 “很棒的游泳池”

C酒店 “喜欢”

B酒店 “很棒的餐厅”

A酒店 “喜爱”

C酒店 “很棒的体验”

B酒店 “乏味”

这里只是列举了其中几条记录,这份表格可能有几百甚至几千页。

利用MapReduce,你可以编写一个功能,找出符合条件的每家酒店名称,并针对每家酒店整合出一组评论。

在上面例子中,“B酒店”出现了3次,因此Map功能可能创造以下信息集:

B酒店:‘很棒的游泳池’‘很棒的餐厅’‘乏味’

因此,Map功能帮我们发现B酒店的所有评论,但是这还不够,我们还需要利用Reduce功能进行下一步分析。

此项功可以帮助我们在Map创建的数据集基础上进行各种分析。在此例中,我们想要找到只含“很棒”这个词的评论。Reduce功能会写出如下电脑编码:

“只要发现评论中含有很棒这个词,内部计数器就+1。”

内部计数器通常会显示得分,或者某个特定数据集中“很棒”这个词的数量。在此例中,B酒店将排在首位(有两个“很棒”),然后是C酒店,最后是A酒店。

因此在这个例子中我们得到了什么?我们在原始非结构化的数据基础上发现了共同点,并且基于商业目的进行分析。

尽管看似很简单,但这就是MapReduce及相关技术的力量:提取隐藏在数据中的规律。

MapReduce的惊人之处在于它能够对数以亿计的数据信息进行分析,然后发现其中的规律。

现在你能感受到这种潜力吗?

旅游领域中大数据的状态

大数据技术在大量数据中发现规律的能力显然为旅游业提供了很多的机会,来重塑针对消费者的营销和销售方式。

毋庸置疑,那些拥有大数据项目的企业能以一种全新的方式向消费者销售旅游产品。

目前在大数据储存公司Acunu任职的Emmanuel Marchal对于旅游业大数据的状态进行了简要的描述:

大数据应用程序正在从分析阶段向真正的个性化阶段过渡。例如,真正的个性化是指,旅游网站能够根据旅游者的具体需求、爱好和此前的购买行为,为不同的旅行者提供不同的酒店选择,而不是基于旅行者的类别提供大众化的选择。

真正的个性化是主要的驱动力,是旅游业大数据的“重中之重”。

OTA和其他旅游企业应该把大数据看成是“必须的”,而不是“可有可无”。

关于大数据,2009年开始有人谈论,2010年很多公司开始启动大数据项目,2011年略见雏形,那么2012年会是广泛实践大数据项目的开端吗?除了个性化之外,Hopper公司也在这方面努力尝试,并且提供了另外一个典型的例子来证明大数据是如何服务消费者的。

针对自然语言处理和地点相结合的数据的大规模分析使得“附近500美元以下的海滨度假酒店”这样的搜索成为可能。尽管这需要技术整合,大数据处理应用程序使得它们成为可能。

展望未来

虽然个性化是“重中之重”,旅游业中使用大数据的潜在用户很多。

地理围栏(请点击此处注释)技术出现了,此技术可用于监测靠近一个特定的景点或商户的旅行者。

最近推出的Foursquare Radar功能是这种应用的一个很好的例子,在你希望到某地并进行了设定之后,当你在它附近时,你的手机就会自动提醒。

这项技术就是大数据:通过你手机的GPS功能搜寻实时的地理位置信息,然后提醒你在某个特定区域。

这项功能可用于数以亿计的消费者,此过程中需要收集和处理的数据量在几年前是无法想象的。

试想一下:每天有多少用户使用GPS导航功能?地理围栏技术对于营销人员来说带来的潜力是巨大的。

图像数据处理技术:每天在有几十亿张照片在互联网上上传,这代表着超大的容量。

图片共享应用程序(如Instagram)是与好友分享精彩瞬间的绝佳方式,但这些创业企业的真正价值在于他们在后台收集的数据。每张图片都含有大量的数据,通过进一步分析才能发现用户的主要信息。

Color,这家备受争议的创业企业在推出产品之前就获得了天价的估值,他们希望去收集的数据的巨大潜力说服了投资者。

旅游业中,创业企业Jetpac已经采用了图像处理技术,给社会旅游领域注入了不同的色彩。

近日被eBay 收购的创业企业Hunch也是在分散数据中发现规律的很好例子。

他们的API和某些公共测试工具让每个人发现类似“40%喜欢斯巴鲁汽车的人也喜欢入住五星级酒店”这样的结论。(当然这不是个实例)

尽管这种相关性看上去很可疑,但是想象一下当你试图针对旅行者进行交叉营销时,这样的关联性会多么有价值。

Taste Graphs将了解客户的“某件事”变成同时了解“很多其他的事”。Taste Graphs应用程序的使用在将来肯定会得到广泛的应用,从在线零售商到旅游业。

总之,大数据不是你可以从供应商那里买到的惊奇魔术盒。

大数据是这样一个概念,即我们每天产生的大量数据,并且随着技术应用的发展,我们可以更好地出售产品及服务。

你准备好了吗?