ZDnet 发表于:14年06月06日 17:53 [综述] DOIT.com.cn
在本周举办的Hadoop峰会上,Actian公司表示其将以进一步提升Hadoop紧凑程 度的方式在业界掀起巨大波澜。看起来他们所言非虚,依靠其Vector产品、该公司确实已经实现了这一承诺。Actian公司顾问兼阿姆斯特丹大学高级研 究科学家Peter Boncz教授在这里与他的在读博士生们讨论了纵列数据库在设计上如何给分析数据库系统带来变革,又是怎样在单服务器领域一路保持领先。
“它是目前市场上速度最快的数据库引擎,”Boncz不无自豪地指出。“它率先采用了多项正逐步走向主流的先进技术。”
早在着手开发原本被称为Vectorwise的Victor产品之前,Boncz就已经拥有非常丰富的分析型数据库系统设计与构建经验。他在 Vectorwise产品之前就曾经使用过此类设计思路,相关成果也当之无愧地成为最早的纵列存储数据库之一。“它掀起了一股浪潮,自此在关系领域中配备 一套特殊分析型数据库引擎开始成为主流,”他解释道。“在此项工作结束的数年之后,我们又萌生出新的想法。我们将此视为绝佳新机遇,并最终在 Vectorwise当中成为了现实。”
根据Boncz的说明,当Vectorwise被创造出来时、Hadoop项目还仍然处于起步阶段,但Vectorwise却切实成为Hadoop 基础设施当中的原生组成部分。“从某种意义上讲,我只能说我们交到了好运,因为Vectorwise的设计方案能够与Hadoop以及HDFS(即 Hadoop分布式文件系统)顺畅对接,”他表示。“HDFS真的很难被导入现有数据库系统,因为它仅仅是一种文件系统。通常情况下,它本身无法实现直接 导入。”
他解释称,Vectorwise所采用的纵列存储机制对于数据来说并不算是合适的打理方式。“在纵列存储机制中,大家需要寻找其它方法来进行数据更 新。而这已经深深融入了Vectorwise的血液当中,”他指出。正是这种先天特性让他的设计成果能够轻松融入HDFS的原生环境。“以原生方式融入 Hadoop的第二项标准性成就在于YARN集成。大家必须保证能够在对Hadoop资源进行管理的同时,既不会导致其它作业发生崩溃、也无需干扰到任何 也在使用这套Hadoop集群的其他用户。”
Boncz认为,企业用户应当认真考虑Actian Vortex而非继续依赖他所谓的“遗留组合”。通常情况下,企业用户会将SQL/Hadoop解决方案作为组件添加到传统数据库系统当中,但需要强调的 是这类数据库系统在设计思路上往往根本没有考虑到分析型工作负载的具体要求。他警告称,这样的处理方式并不适合执行高速查询操作。“这也正是Vortex 在执行速度上远高于传统系统的原因所在,”他解释道。除此之外,Vortex还能给企业竞争力带来提升,因为它支持分流更新机制、从而避免系统更新所带来 的HDFS关闭状况。
“SQL用户及相关用例往往是将成熟度放在第一位,这其实是种很大的误解,”他指出。“Vortex将彻底改变这一切。”这是因为Vortex所采 用的迥异更新机制能够帮助大家在更新的同时继续执行写入操作。“这使得Vortex能够在无需对HDFS造成影响的前提下完成更新。我认为这一点在目前的 市场上可谓独一无二。”
这款全称为Vector Hadoop Edition(也就是前面提到的Votex)的产品将由Actian以商用形式于本月底推出评估版本。大家可以点击此处访问Actian公司官方网站,届时这里将提供下载。Boncz还建议称,希望深入了解Vortex如何运作以及能为业务带来何种帮助的朋友不妨点击此处查看他最近发布的博文。