大数据生态地图3.0版出炉

2012年,FirstMark资本的Matt Turck绘制了大数据生态地图2.0版本,涵盖了大数据的38种商业模式,被业界奉为大数据创业投资的清明上河图。两年后的今天,经过漫长的等待,Turck终于推出大数据生态地图3.0版本。

在大数据生态地图3.0版中,Turck从一个风险投资者的角度对两年来大数据市场的最新发展进行了深入的研判,并对未来趋势进行解读,以下是Turck眼中大数据市场的几个最为关键的演变趋势:

竞争加剧:创业者们纷纷涌入大数据市场,尾随的VC们也是挥金如土,导致大数据创业市场目前已经非常拥挤。例如一些创业项目类别,例如数据库(无论是NoSQL还是NewSQL),或者社交媒体分析,目前正面临整合或去泡沫化(随着Twitter收购BlueFin和GNIP,社交分析领域的整合已经开始)

虽然大数据创业市场已经人山人海,但是依然有足够的空间给新的创业公司,现阶段大数据基础设施和分析工具领域的创新吸引了大量的资金,当然,这类大数据创业本来就是资金密集型项目。

大数据市场尚处于初期阶段:虽然大数据的概念已经热炒了数年,但我们依然处于市场的早期阶段,虽然过去几年类似Drawn和Scale这样的公司失败了,但是相当多的公司已经看到了胜利的曙光,例如Infochimps、Causata、Streambase、ParAccel、Aspera、GNIP、BlueFin Lanbs、BlueKai等。

还有不少大数据创业公司已经形成规模和气候,并且获得了海量融资,例如MongoDB已经募集2.3亿美元,Plalantir9亿,Cloudera 1亿。但是就成功的IPO或公司而言,市场尚处于早期阶段(虽然已经有Splunk、Tableau等成功IPO)。

此外,目前阶段一些传统IT巨头已经展开了收购大战,例如Oracle收购BlueKai和IBM收购Cloudant。在很多大数据创业领域,创业公司们依然在为市场领袖的地位展开混战。

从炒作回归现实:虽然经过几年声嘶力竭的热潮后,媒体对大数据已经有些审美疲劳,但这恰恰是大数据真正落地的重要阶段的开始。未来几年是大数据市场竞争的关键时期,企业的大数据应用从概念验证和实验走向生产环境,这意味着大数据厂商的收入将快速增长。当然,这也是一个检验大数据是否真的有“大价值”的时期。

大数据基础设施:虽然Hadoop已经确立了其作为大数据生态系统基石的地位,但市场上依然有不少Hadoop的竞争和替代产品,但这些产品还需要时间进化。基于Hadoop分布式文件系统的开源框架Spark近来成为人们讨论的热门话题,因为Spark能够弥补Hadoop的短板,例如提高互动速度和更好的编程界面。而快数据(实时)和内存计算也始终是大数据领域最热门的话题。一些新的热点也在不断涌现,例如数据转换整理工具Trifacta、Paxata和DataTamer等。

时下一个关键的争论是企业数据是否会转移到云端(公有云或者私有云),如果是,什么时候会发生?一些基于云端的Hadoop服务创业公司例如Qubole、Mortar坚信从长远看所有企业数据最终都会转移到云端。

大数据分析工具:就创业者和VC的活跃度而言,大数据分析是大数据市场最活跃的领域。从电子表格到时间线动画再到3D可视化,大数据创业公司们提供了各种各样的分析工具和界面,有的面向数据科学家,有的选择绕过数据科学家直接面向业务部门,由于不同的企业对分析工具的类型有不同的偏好,因此每个创业公司在自己的细分领域都有机会。

大数据应用:大数据应用的发展进程相对缓慢,但目前阶段大数据确实已经进入了应用层。从大数据生态地图3.0中我们可以看到,一些创业公司开发出了大数据通用应用,例如大数据营销工具、CRM工具或防欺诈解决方案等。还有一些大数据创业公司开发出了面向行业用户的垂直应用。金融和广告行业是大数据应用起步最早的行业,甚至在大数据概念出现之前就已经开始了。未来大数据还将在更多行业得到广泛应用,例如医疗、生物科技(尤其是基因组学)和教育等。