2012年7月24日,主题为“芯动大数据 智领大机遇”的英特尔大数据论坛在北京举行。会上,IDC中国企业级系统与软件研究部高级研究经理周震刚分享了大数据市场的观察。
周震刚表示,IDC一直把大数据、云和移动以及社交这四个主题当做未来IT的主要方向。IDC在大数据方面已经做了大概三四年的研究,IDC中国从去年开始对大数据市场做了深入研究。
什么是大数据?——四个“V”
周震刚介绍道,IDC对大数据的定义是四个“V”:高容量的数据、数据类型多样化、持续性不断刷新的数据,以及为用户带来最终的价值。
大数据的IT市场包括四个层面
周震刚表示,IDC认为大数据的整个IT市场主要包括了四个层面:
第一个层面是IT基础架构层面,包括服务器、存储、网络、I/O等等方面的硬件的设施以及相关的基础架构软件;
第二个层面,上层数据的组织和管理;
第三个层面,更上层对数据的组织;
第四个层面,更上层的分析和挖掘的市场,包括对最终用户提供的最上层的决策的支持,数据展现的市场。
这四个层面是大数据IT市场完全包含的四个方面。大数据市场到底有多大?IDC有一个未来的预测,我们看到2010年全球大数据以及相关的硬件、软件和服务市场,大概是30亿美元以上的市场,而我们在2015年整个市场将超过170亿美元,平均增长速度每年超过50%,这里面我们也给出了IDC的具体大数据的定义。我们看来大数据不仅仅是在数据分析领域,目前来看已经逐渐开始影响我们所说的数据中心、移动、包括社交网络等相关其他的主题的市场。IDC总结了全球以及中国大数据的市场研究,我们提出了在中国大数据未来十个可能成为大数据市场发展的重点方向,所以今天我们主要是为大家分享IDC在中国大数据市场的十大预测。
中国大数据市场的十大预测
在对大数据的IT市场结构进行了剖析之后,周震刚分享了IDC对于大数据市场的十大预测:
第一个预测,未来两三年当中,Hadoop会有一个很明显的商业化的过程。可以拿一头大象比较一下另外一个很熟悉的动物小企鹅,Linux市场和Hadoop市场是非常相似的发展过程。大概十几年前,90年代初,当Linux项目刚刚开始的时候经历了几个过程,从项目开始到Linux社区的成立,总共经历了大约三四年的时间,而我们看到Hadoop项目2006年提出到现在,基本上的确立也是在三四年时间。Linux的生态环境的形成,主流的商业方案基本是在2000年左右,我们可以预测这头大象可能会和企鹅跑得一样快甚至更快,我们看到2010年到2011年之间Hadoop的生态环境已经形成,很可能在2013年甚至在今年就会形成非常主流的Hadoop的商业化的打包产品不断地推向市场。
第二个预测,Hadoop发展非常快的前提之下,很早期的Hadoop项目也面临着种种挑战,这头大象在跑的过程中也遇到一些障碍,值得我们在未来关注。首先看这头大象初始的时候是不是完全为了验证概念或者完全做试验开发的项目,如果有比较明确的行业应用目的,可以说这个项目在未来有比较好的发展,有一些完全属于验证概念的项目就会受到一些挑战。项目实施初期是不是使用了一些关键案例,可以让项目继续推广。再就是项目开发是否是适合用Hadoop的环境,而不是针对传统的数据库就可以解决的市场,非要用Hadoop来实现,反而是背道而驰。如果说这三个方向都能够非常适合,那么Hadoop项目可能会继续走下去。但是有一些早期项目可能会被优胜劣汰,留下来都是精华的Hadoop项目。
第三个预测,说Hadoop是完全开源的市场,开源的市场很可能只是一个完全免费的市场,难以给厂商带来更多的机会,这些厂商不会投入很大的力量在这方面,因为它拿不到什么绩效。既然我们所有的水都是免费,为什么还要买瓶装水呢?这完全可以告诉大家,和免费竞争并不是不可能的,另外在免费的市场带来的机会,绝不仅仅是免费的一小块市场。Linux市场在过去几年间,图中蓝色是Linux纯操作系统的市场,它的增长速度每年百分之十几,但是它带来的基础架构软件、系统管理软件、开发应用软件,比如说数据库、开发工具以及应用软件包括Linux服务器硬件的增长,未来几年增长了几倍之多,所以应该说开源软件的发展其实会给很多相关市场带来更多的机会。
第四个预测,大数据会带来更多的软件公司之间的收购。大数据软件市场的生态系统有很多类型的软件厂商,包括传统的关联数据库厂商,以及多维展现做分析的软件厂商,对Hadoop分析包括管理,包括Hadoop应有的厂商这里面有很多我们熟悉的公司,也有很多不熟悉的小公司,后面这些我们不太熟悉的公司很可能在未来被大公司所并购。我们看到这个市场没有一个公司能够覆盖整个市场规模,所以未来几年将会看到很多收购,尤其是前端的展现,最终能够提供给最终客户的厂商,将会有很多并购发生。
第五个预测,在Appliance的市场,包括传统的DataWareHouse的时候,还有NoSQLAppliance,未来有两个方向,一是更为开放的架构,通过开放的架构减低自己的成本,另外也有很多企业级的厂商会采购很多打包的产品,实现它的功能,这种Appliance? Server实际上就是未来的趋势之一。
第六个预测,大数据将在未来一两年从我们看到的传统的互联网和电信方面的应用,现在看到大数据都集中在互联网,现在看到联通、电信也在着手做很多大数据的开发,未来几年我们将会看到这个大象逐渐向更多行业发展。比如说政府,我们看到一些智慧城市的项目中已经有了实施,大数据如果能够在政府的应用更广泛,可能上周末的暴雨就有更及时的分析和预测,我们也不会遭受那么大的损失。另外能源方面的仿真的分析和应用,来寻找能源挖掘的地点,也将碰到大数据的一些应用。另外,制造业上下游的产业链,以及金融业的金融分析和预测,都是大数据未来会走向更深入行业的趋势。所以说未来几年,用户将了解大数据,将不仅仅是处理网络相关的属性,而是说行业方面的,对数据流的监测和分析将有更多的需求。
第七个预测,大数据创造新的细分市场。我们原来一直讲云计算时代,未来可能会有DataService,其实IDC也是做这个工作,把数据当做服务提供,未来可能有一些专业的数据带来来做一些工作,用户开始把数据创造出来以后,交给我,我有一个分析平台和专业知识,帮助你分析数据背后的信息,然后再把结果返回给你,我们可能会出现数据代理。在数据未来多种多样的情况下,可能有些统一的信息访问平台的细分市场,这个细分市场用来把大数据做统一管理和分析组件。此外还有一些市场,比如说社交方面,社交将从传统的SocialMedia到Socialytic,也就是说基于社交分析更多会和企业内部的管理系统结合形成真正的无缝的社交分析。大数据市场现在相关人才还非常短缺,未来几年大数据市场一定有更多的培训市场机会,甚至高校会开展数据分析的课程,会有专门的数据分析工程师的出现。当然还有可能有些市场是我们根本没有想到的。
第八个预测,打包的大数据行业分析应用出现。从传统概念来讲,大数据太复杂了,无法形成打包好的分析应用,但是在未来几年中,某一个行业的应用会形成一定的共性,将会有厂商根据行业的分析应用,打包好一些分析的应用,基于大数据的分析应用推广到行业方面,这不仅是做数据分析的专长,也需要很多行业方面的专业专长,将会有很多行业的ISV加入到大数据行列中,基于大数据平台开展他们的开发应用。
第九个预测,大数据推动基础架构向Scale-out发展。因为从比较传统的数据处理方式和大数据的处理方式来讲,我们发现在处理结构化和非结构化数据方面,它们的存储方式不一样,更多的大数据采用分析存储的方式更有效率。在对数据进行处理的时候,因为大数据的类型比较复杂,数据量比较大,可以通过分布式的处理方式把应用复杂分散到分布式系统的各个节点上,而传统的数据处理将是运算能力非常强、CPU主频非常高的一台机器来处理,而不是大数据这种多个节点、多个CPU核数来处理,这代表了大数据时代发展方向从Scale-up转向Scale-out。
第十个预测,中国成为全球最重要的大数据市场之一。我们看几个数字,中国人口数是全球第一,去年中国GDP是全球第二。另外七千万台PC的出货量和九千万台智能手机的出货量,这都是全球第一的出货量,也就造就了全球第一互联网用户数和全球第一的互联网移动用户数,创造数据的规模远远超过全球其他各个国家,即使一些发达国家,由于没有这么多的人口,没有这么多的互联网和移动互联网的用户,所以数据量产生的过程中也难以和我国相比。我们看到服务器端、数据中心端,服务器的出货量,去年中国126万台,全球第二。而存储方面两EB大概两千个PB的规模,只是服务器端存储出货量也是全球第二,所有数据都说明,无论是客户端还是企业级,中国都是非常重要的市场,这势必诞生新的模式来让全球认识中国的重要性。可以拿一个过去的例子来比较,为什么大家会看到华为和中兴在通信领域获得了这么大的成功,并不完全他们的低价冲击了其他市场,是因为华为和中兴有中国人口基数的通讯量,它的交换机能够适应中国十几亿人的通话量,所以它的产品在任何一个国家都能获得成功,而国外的产品未必适合中国大规模的能量。所以我们可以推到大数据市场,在中国的大量数据处理所产生的解决方案将可以适用其他任何一个国家,其他国家推出的解决方案未必势必我们国家。我们也期待在大数据市场中国企业能够获得更多的成功。
大数据给市场带来的将是更广泛的机会,对于中国来说这个市场是非常有前景的,值得大家重视的一个市场。另外各行业的客户和各行业的开发商也应该在大数据市场抓住机会,借助自己的优势创造更多的价值。