企业的“大数据”何时放入“云端”?

在大数据的世界里,云计算扮演着很重要的角色,特别是在那些短期工作和应用程序当中,因为这些领域的很多数据已经在云计算中。

对于大部分的人来说,云计算是一个很大、模糊且有点遥不可及的梦。一些人在看待大数据战略时,会将其等同于将大数据放入云端,但是这样的说法是真的有远见还是只是简单的重复行业会议中的观点。

http://www.cabotsolutions.com/wp-content/themes/complexity/ddslider/images/ci.png

实际上,大数据和云计算有很大的重叠和交集,所以企业很可以很明确的宣称自己正在利用内部部署的Hadoop、NoSQL或者是企业数据仓库环境进行基于云计算的大数据战略。同时还要提醒大家:云计算被广泛的认为是包括除了“私有部署”以外或者是代替公有云、SaaS和多租户托管环境。

但如果你将云计算的定义限制为公共订购服务,你就会遇到一个核心问题:需要确定哪些大数据应用更为适合公有云/SaaS环境或者是传统的内部部署。换句话说:通过外部的服务提供商的管理,何时才能提高大数据的可扩展性、弹性、效能以及成本效益、可靠性。以下是四个关于大数据迁移至云端的用例,帮助辨别你的大数据是否已经处于云端了。

企业应用已托管在云中对于很多企业来说,特别是中小企业来说,如果你用的是外部服务商提供的基于云计算的应用程序,实际上企业中的大部分交易源代码已经在公有云当中。如果你有很多的历史数据都在云计算平台中,也许已经累计构成大数据了。

http://www.resource-media.org/wp-content/uploads/2012/11/Election-2012-social-media.jpg

此时,利用外部服务提供商或者是其合作伙伴提供的数据分析增值服务比完全依靠企业内部的资源更有效,服务包括客户流失分析,营销优化,或异地的客户数据的备份和归档服务。

高容量的外部数据源则需要预处理

举个例子,若是你正在通过收集社交网络来进行客户的情绪监控,也许你的企业内部没有服务器、存储和带宽能够全面的监测这些数据,但是通过基于公有云的大数据服务,你就能够很简单的利用社交媒体过滤服务来对客户的情绪变化进行监控。

企业内部无法承受的战略应用

http://siliconangle.com/files/2012/06/hadoop-big-data.png

若是企业内部已有一个基于应用程序的大数据平台,如专用的Hadoop集群的高容量ETL非结构化数据源,通过公有云来解决新的应用程序是比较可行的,例如,多渠道营销,社交媒体分析、地理空间分析、可查询归档和弹性数据等。对于不适合当前平台的应用程序来说,一个按需收费的服务的成本效益是最好的。

事实上,企业如果想要尽快处理PB级规模的多种结构的流媒体的大数据,公有云是唯一一个可行的解决方案。

分析沙箱的弹性配置

若是你需要进行数据探索的是一个生命周期较短的项目,订单量又是数量级的时候,云计算可能是唯一可行的或经济实惠的选择。你可以快速的为项目配置基于云的存储和计算能力,当项目结束的时候,企业可以快速的取消这些配置。这种模式可以称之为“泡沫集市”部署模型,可以说是为云量身定制。

只要你遇到以上任何一种情况,基于云计算的大数据战略问题也就会随之而来,随着云计算和大数据服务的成熟,价格,性能,可扩展性,灵活性和可管理性都将会得到改善,但这个问题仍然还是会存在,只不过阶段不同了。再过几年,越来越多的应用和数据迁移到公有云之后,利用你现在的服务器来运行你的大数据应用似乎也不太实际了。所以企业要懂自己的大数据战略,同时还要搞清楚企业数据是不是已经在云端了,并及时做好战略的调整。