微软公司日前公布了围绕Windows和SQL Server 12的更多细节,这两款操作系统可以通过与Apache Hadoop更加紧密的结合来主持大型数据分析,Apache Hadoop作为处理每天产生的大规模非结构数据的开源云平台应用日渐普遍。
凭借这种改进,微软公司可以将大型数据带入主流。按照他们的说法,随着市场上的工具趋于复杂和价格高昂,只有拥有大笔IT预算的大型企业才能从这种数据分析中受益。
微软公司的战略是推荐偏向LINUX的Hadoop来搭配Windows环境,可以为企业用户提供一种通过熟悉的桌面系统应用软件(比如EXCEL或者BI工具这样的Microsoft PowerPivot)来一键式,无缝和同步访问结构化数据和非结构化数据。
微软公司青睐Hadoop并非什么新鲜事。诸如Cloudera和Datameer这些云新兴企业在过去几年里一直都在强化这款平台来面向企业级消费,用来扩展管理和配置工具,针对流工作编程甚至通过电子数据表格类型的前端来实现Hadoop数据更加轻松的使用和管理。另外,微软的这一举措也是雷蒙德在今年8月有意将Hadoop和SQL整合在一起的佐证。
不过微软对Hadoop的立场自从2009年微软公司技术总监David J. DeWitt对Hadoop来替代SQL持否定态度以来发生了180度的大转弯,那时DeWitt曾说过“我们绝不会将Hadoop代码应用到我们的任何一款产品当中去”。
显然,微软公司绝不会对Hadoop逐渐成为大型企业级用户选择的平台这一事实坐视不理,包括脸谱,谷歌,IBM和很多很多大型企业都在使用Hadoop。甲骨文最近也宣布大型数据应用工具会将对Hadoop的支持包括在内。甚至戴尔公司去年8月也公布了销售预装Hadoop服务器的计划。
另外,微软公司当然不会忽略了为脸谱和推特这样的大型企业分析大规模数据流所带来的收益。企业代表着一系列的行业,包括金融,卫生,政府,学术,政治和娱乐等各个行业,都已经从收集和检索这些大规模数据中获得了非常有价值的成果。
现在所面临的真正挑战是如何实现Hadoop与SQL Server,Windows Server和Azure这些我们所熟悉的标准桌面系统应用软件的无缝对接,这些桌面系统应用软件所执行的大型数据分析在计算机科学领域都是不需要一个级别的。对此微软公司并不孤单;日前微软公司宣布与来自雅虎的Hortonworks(成立3个月时间)结成合作伙伴关系,以此来弥补Hadoop和Windows Server以及Azure之间的差距。
微软公司计划在今年年底前推出以Hadoop为基础的Windows Azure服务社区技术预览版;以Hadoop为基础的Windows Server的社区技术预览版预计在2012年随后推出。
为了实现更紧密的整合,微软公司还推出了Hadoop Connectors for SQL Server和Parallel Data Warehouse的最终版本,企业用户可以使用这两款软件将Hadoop与他们现有的SQL Server环境整合起来。
除了Hadoop以外,微软公司还展示了他们的Data Explorer,这是一款帮助企业级用户轻松挖掘,丰富和共享数据而设计的原型技术。这款工具预计会和Windows Azure MarketPlace整合在一起。;另外微软公司还介绍了他们的Power View技术,也就是之前的Project Crescent,这种技术可以实现Windows设备的交互式触摸功能。