SQL Server引入Hadoop大数据处理计算

微软SQL Server的用户将体验引入分布式计算(Hadoop)的大数据处理。公司已经发布了代号为Denali的代码,这种代码可以帮助用户把Doug Cutting的开源Java架构插入到SQL Server 2008 R2、巨型数据库的SQL Server Parallel Data Warehouse以及微软下一代的数据库版本中。

Hadoop由Cutting在受了谷歌的软件架构启发后创建。现在Hadoop已经成为集群服务器上数据量巨大的计算行业的标准。这很大程度上得益于他的开源特征。Hadoop现已被亚马逊、Facebook和Twitter等大公司采用。

行业人士认为Hadoop能从复杂的数字计算中提取用户所需要的数据,他能从大量的数据中察觉到用户感兴趣的细微的变化和状态更新以此使得服务器做出合适的应答。

微软在2006年就开始了对与Hadoop同样引人注目的Dryad的研究。今年早些时候公司计划将Dryad整合到SQL Server和他的云操作系统Windows Azure cloud中。现在看来Dryad现在在SQL Server的大数据爱好者中有了竞争对手了。

微软的连接器分为SQL Server Parallel Data Warehouse Hadoop 连接器和SQL Server Hadoop连接器。连接器使得后台数据和前台数据在Hadoop和微软数据库服务器之间进行转换。微软方面表示连接器使得用户能理解Hadoop中非结构化的数据并将之拉回SQL Server中。