SQL Server 2012全力打造大数据特性

同其他IT厂商一样,微软公司也做好了全面进军“大数据”领域的准备,而即将发布的SQL Server 2012将成为微软大数据战略的支点。最新的数据库平台将提供一系列的大数据功能,其中包括Apache Hadoop连接器、开源分布式计算架构,能够存储并处理海量的结构化与非结构化数据。

为了让用户对于SQL Server 2012的大数据功能有一个更直观的了解,记者采访微软数据库平台专家Mark Kromer,让他来谈一谈SQL Server用户如何使用新的大数据功能,以及SQL Server的开源以及云计划。

从去年开始,微软就逐渐向开源社区抛出橄榄枝,比如发布ODBC Linux驱动,希望帮助用户从基于Linux的应用迁移到SQL Server平台上。而微软还计划提供SQL Azure与Linux之间的连接功能,这一系列举动都表明了微软公司对开源用户的关注。那么请问微软深层次的动机是什么?公司是否还有进一步关于Linux以及其他开源技术的计划?

Kromer:除了Linux ODBC驱动的发布之外,我想目前微软最大的动作还是发布SQL Server团队添加对Hadoop架构的支持。

我们知道Hadoop支持将出现在SQL Server 2012中,微软是否希望用户从今年开始就是用这一技术?

Kromer:其实用户已经可以到微软的网站上去下载Hadoop适配器了,这个功能是针对SQL Server 2008 R2的。它将为用户提供Hive以及Sqoop服务,使得用户可以在Hadoop环境下充分利用SQL Server数据仓库以及BI解决方案的丰富功能。用户还可以在Windows Server或者Windows Azure平台上,将数据分布到Hadoop节点中以构建大数据分析解决方案,然后再使用SQL Server的一些自带工具,如Power View、PowerPivot,甚至是Excel来数据分析。而这部分数据就是我们所说的非结构化数据或者大数据,它们是无法在传统的数据仓库以及报表系统中进行处理的。

那么微软如何处理与Hortonworks的合作伙伴关系,而客户又该如何通过这种合作方式来利用SQL Server的Hadoop功能呢?

Kromer:微软的合作伙伴Hortonworks将负责Hadoop分布式架构,它可以运行在Windows Server上,用户可以构建企业内部部署的大数据解决方案,也可以在Windows Azure平台上使用基于云的Hadoop服务。

微软一直在加强他们的云计算战略,比如放宽了SQL Azure的数据库大小限制,发布了SQL Azure Compatibility Assessment以帮助DBA和开发者评估迁移到云数据库的难易程度。那么在SQL Azure推出满两年的背景下,微软对于用户迁移到云平台的期待是怎样的?

Kromer:我所接触的SQL Server客户,在技术社区上的态度是非常具有代表性的,尤其是针对SQL Azure数据库的迁移,他们通常会在以下几种情况下考虑云数据库:1、将SQL Azure作为开发测试环境,DBA不用再进行环境的设置和搭建,也无需维护多个开发实例;2、对于一些短期的应用来说,SQL Azure的使用率也是非常高。这样做的好处在于用户无需在对数据中心的结构进行转换,SQL Azure让扩展和大量的SPIKE;3、用户往往倾向于将第二层或者第三层的应用以及其他旧有SQL Server数据库迁移到SQL Azure,以降低维护、硬件以及许可证成本。而且由于SQL Azure与SQL Server所使用的链接和工具都一样,因此这样的迁移显得更加直接了得。当微软正式发布通用版本的SQL Federations和SQL Azure报表服务之后,相信SQL Azure的普及率还将有更大的提升空间。

除了SQL Server 2012的发布,用户还能够在新的一年中看到怎样的变换?

Kromer:全新的数据库平台还不够吗(笑)?我所期待的是一些新的Azure产品发布,目前它们还处在试用阶段,比如SQL Azure报表服务、SQL Federations scale-out查询、Azure Connect for VPN连接到云以及数据同步等。