线性资本:早期大数据投资的一些想法

        8月29日下午,由七牛公司主办的主题为“数据重构未来”的“七牛·数据时代峰会”在上海国际时尚中心继续举行。线性资本创始人王淮进行了《早期大数据投资的一些想法》的精彩演讲,以下为演讲实录:  

 
        王淮:我跟大家分享的是关于大数据时代的一些想法。我在准备PPT的时候,是不是要透过现象看本质,想了半天发现,做投资这个事情,完全不是大数据的活,看来看去,前后大概看了七八十家数据类型的公司,最后大概投了四五家,七八十家的东西,完全没有办法形成大数据的这种,有一些数据我们可以获得到,但是可靠性是值得怀疑的。
 
        所以开始的时候,先把数据链条给大家解释一下,关于数据处理这件事情,究竟有哪一些内容,现在我虽然是线性资本的合伙人,我之前做过工程师,做过很多数据相关联的事情。很多人知道我是关于我在facebook的工作,在这个过程当中,有这些链条。第一步是数据或许,先这有这些数据,才有事情可以做。很多人没有意识到,从我们以前做的很多事情来看这个是最最重要的,包括清洗数据处理这部分,因为很多是属于噪音,还有一些是数据获取过程当中是失败的。数据来了,一开始的时候,可能是纷繁复杂的,但是要让它变得有效,必须要结构化,让这些数据能够被存储被展示,互相能串得起来,对于历史上的发生的事情有一个完整的描述。有了结构化的描述之后,最后还是要大规模的存储,完了是处理,除了之后,会变成跟你的业务模式比较相关的那类的查询。
 
        像很多公司以前在那里,很方便的用类似思科(音)这样的方式来查询他处理完了之后的一些,就是比较高层一些的数据,因为底层的数据,从一开始的到最后,获取的是与你业务比较贴合的数据。但是真正对于你的业务产生价值,这里面涉及到机器学习、数据挖掘的事情。在处理查询这部分,很多人讲的人工智能机器学习都是指的这部分工作。在后面学习出来的数据,学习出来的结论,学习出来的报表如何可视化的展示,否则只有电脑看得懂,人看不懂没有用的。这些可视化的,怎么放到你的最后决策过程当中。这个是最后那部分能够真正真正,很多公司讲大部分,数据处理,最后都是为了这一步,如果不能到这一步,这些公司做大数据是没有意义的。最后是一个循环过程。
 
        很多的创业都是在刚才的步骤当中寻找这些切入点,刚刚提到很多的步骤,更高一点层面看,可以分成这么几类,一个是基础架构这一块的,包括获取、存储这一些部分,这一些在美国很多都是比较大的公司,在中国很多市场,也是属于大公司的。因为这一块是属于苦活、累活、重活,需要很多资本投入。阿里云、金山,像今天的主办方七牛一开始也是从这个角度切入的,只不过它的切入角度比较有意思。浮云,一些中小企业,非常适合中小企业起来的特性,比如文件,小文件的预处理,包括这上面起来的又拍云、青云、ucloud这类东西,有些是注重云存储,有一些是注重云计算。美国的这边的一些公司,比如Qubole是美国的一家公司,他们把数据变得相对容易使用。在中国也有一些,不一定是这个方面,有一些这样的角度切入的公司。这些我认为都是一些服务,他们做的是统计服务,还没有到后面的。
 
        在美国,我这边只放了两张,其实有很多家非常不错的大的公司,在我这个图上面显示出来的标红的公司都是十亿美金以上的,中国基本上还没有。百分点算一个,在上面做了很多年的。但是它真的还在努力的状态下。展示层面,tobleau还有另外一家公司,做得不错。中国我看到几家创业公司,好几家公司高管出来,想在可视化、数据展示方面做一些工作。这个是大数据方面我们看到的正在起来的,很多人关注的方向,美国明显要走得比中国要靠前一点。
 
        我们跳回来,讲大数据公司,很多人关注大数据的服务、基础架构这些供应商。大家忘了,最大的大数据的供应商,其实像阿里、京东、腾讯这样的大公司,又在这方面有大投入的公司,这些公司是最大的大数据的公司。金融的银联,我不知道它有没有能力处理这样的大数据,它如果把这个能力,它要做这样的事情,比起很多外面的公司要容易得多。最大的原因是它把控了数据源。风控最最重要的是你如何有效的获取,不会被人糊弄掉。对于数据的处理,反而不是最最关心的,因为很多算法可以直接拿来用,只要你的人不会太差,做出来的效果不会百差。游戏应用也是大数据应用非常多的领域。有些领域非常有门槛,主要是在数据源这一块,但是这里面机会非常大。比如医疗,一开始没有大数据的公司展现出来。它要有另外的公司进入。所有的移动医疗,如果将来成功,回看,它最后一定会体现在大数据的层面,很多的服务,表面上看起来的服务,以这个获取很大的成功是比较困难的。
 
        国家安全,这个其实是很多人忽略的。美国一家很出名的公司,价值90亿美金,它最大的买家就是美国政府跟FBA这几个手握国家安全、金融的部门,给他们提供了很多的数据,让他们处理。农业也是很大的一块。很多人并不是想到无人机本身这个市场,是看到的后面的一个行业应用。农业就是其中一块的行业应用。
 
        大家可能注意到了,很多公司都是美国的公司,中国公司现在还是群雄并起的初期。但是  美国这些公司已经产生了十亿美金的公司了。我们可以看到美国公司这些特点,第一是付费意识。刚刚我有一点忘了说了,这些公司都是2B的,很少有2C的。很多2C的是吃力不讨好。因为2B这一块很大的特点,就是它的付费意识要强很多,它有能力让你做到自给自足,中国这部分我们可以看得到它在起来,但是这个还需要有时间去熬一熬。
 
        第二个是专业意识,美国公司有界限意思。这个是我擅长的,不一定要在其他的地方与别的公司竞争。我把有限的资源防盗我特别擅长特别专注的,这一块不管是facebook还是谷歌这一块,他们的思维一直以来都是非常强调这一部分。中国相对会出现很多大公司,说这个东西比较有价值,我们干脆建一个团队,或者我们投一个团队,控股一家公司切入到这一块竞争当中去。
 
        很重要一块是数据源的问题,数据源是控制在这些大公司里面,如果你作为一家公司,你没有这种能力,是没有办法展开合作的。美国的话,让生态系统,相对起得来,我可以提供数据,你给我提供你擅长的数据处理服务。还还有收购意识比较强,你做得好,花一个合适的价格把你团队买下来。很多人不知道,美国一个标准价,你这家团队做得还OK,不是太差的话,基本上一个人头一百万美金。如果特别牛的团队的话,我们看到一个案子,他们开出了一个人头相当于五千万美金的价格。就是他能够出得起,愿意出这样的价格买专业的人士,专业的团队。在中国呢?刚刚提到了付费意识也好,合作意识也好,团队意识也好,非常有待提升的。但是有一个东西,我们看到过去三年来,有一个巨大的变化,就是收购意识,过去三年前我刚刚回国的时候,看到很多公司,这个东西腾讯一做怎么办?后来发现,像腾讯也好,阿里也好,他们也明白了,像自己的这些对,一个是人才的质量,有时候的专业性,还有一个是速度的问题。还有一个是公司的基因文化,这些因素考虑完之后,他们懂得,如果用资本运作,把它在它的产业里面,有一些缺失的一部分,把这部分能力能增加的话,带来整体的资本溢价会高很多。所以我的理解,售后意识的增强,不见得这帮人道德意识更高,其实看到对于这家公司发展而言,带来对于这家公司的增值更大一些。但是付费意识、专业意识、合作意识,对于整个生态系统而言还是要熬的。
 
        再谈一谈,我们所看到的什么样是一个好的大数据投资呢?我认为这三点非常重要,至少其中一点要满足。起不起用户量,你的东西有没有人用,尤其一开始的时候,2B这一块,典型的做法,是分担,一开始很低的价格出去。如果是2B的,最好要收费。如果是小团队。是不是有人去用,用的人反馈如何,这个很重要。上不上销售额,我们认为是2B这个非常重要的一点,最后还是要涉及到销售。美国讲的,不管这个是不是互联网公司,讲半天之后,如果你看它的销售团队,它还是有巨大的销售性质的团队在。所以这样的公司,要思考好,销售团队怎么搭建,是不是需要这样一个合伙人。还有中国的环境下,前三种意识还在形成的过程当中,这个过程当中,意味着你一定要熬,意味着你要有资本的注入。相对现在潜在的资本冬天而言,这种会显得越来越难。所以我是建议,如果你是做大数据的,你有机会拿到下一轮的话,赶紧拿一下这部分的钱,估值不是最重要的。
 
        还有我们看到的这几年的观察,越来越多的公司,开始注重数据建设,有这种意识在的话,市场意识是所有生态系统的基础,没有这种意识的话,没有这些东西的话,东西卖不出去的。
 
        第二块是有经验的数据专家开始创业了,三年前我们看到中国有实力的数据专家,都是从美国回来的。但是这几年阿里、腾讯、百度培养了很多这样的人才。这些人才都很不错。逐渐看到做出来的产品有竞争力有效果。市场在起来,供应在起来。两者结合的话,这个可能是对于大环境的理解。一个行业,原来是空白,是蓝海,我跳进去,这要是纯粹的扩张方式,我就可以把生意做起来,这种机会越来越少,逐渐可以看到有限的钱花在哪方面,做什么样的推广,把钱花在精细化的竞争越来越重要。有限的资源应该怎么花。效率要是如果没有办法提高的话,我认为一辆在海岸边航行的轮船一样,它看不到灯塔,就在那里乱晃,很容易触礁。这个越来越明显,很多人强调数据的效果。看到这个生态市场里面,大家整体的认知,整体上让大数据的创业变得越来越容易。我们投了四家这样的公司。不管是在游戏领域做一些舆情分析监控,神策是做更加高级的有门这样的活,是统计。铜盾(音)是在金融领域里面,是提供强大的反欺诈遮阳的服务,京东都用了它的。我们投的逻辑是有没有庞大的用户量。能不能有销售额。前两家没有,但是铜盾的时候,大家说只要你效果好,我很愿意付费。铜盾已经过了很多轮了。就是你的溶质能力,结合很强的专家,如何把故事讲明白,把钱融到非常非常重要。
 
        最后我想给的建议,切入点,有好几种方式,基础架构比较困难。我觉得越来越多我们看到的,瞄准一个行业做优化。而且别人拿到你的数据拿到你的产品马上可以用的。这样的方式我们很推荐。还有一个熬,还有一个生态合作。你的数据很可能不是直接拥有的。你一定要想办法跟你的上下游,比如七牛这样的公司,它也有很多这样的数据,它可以帮你对接后面的公司,能够让你的数据链能够通得起来。最后一点是销售,很强的销售团队,很多人忽略了这一点。
 
        这个是我的分享,谢谢大家。