上海天玑数据公司总经理董唯元:融合基础架构的思考

主题为“掌控数据经济,重塑商业价值”2014年第十届中国存储峰会今天在北京隆重上演,本次大会共邀请了16位顶尖第三方嘉宾,数十位专家,带来了35场前瞻性演讲+2场圆桌讨论,并首次推出硅谷创始人访谈和存储夜宴活动!

今天我们有幸邀请到七位嘉宾来到软件定义与数据中心论坛:数据价值,一触即发!软件定义这个概念之所以火热是因为用户希望能够更加高效、自动化的去控制、管理和使用各种IT资源,而无需花费太多精力在硬件层面。软件定义存储的概念已经遍地开花,但各大存储厂商对软件定义存储的理解各不相同。

第七个(最后一个)演讲人是上海天玑数据公司总经理董唯元,带来的主题演讲是《融合基础架构的思考》,以下是现场演讲内容实录:

上海天玑数据公司总经理 董唯元 主题演讲《融合基础架构的思考》

我这里要跟大家汇报的是融合基础架构,其实不光是存储,这个概念是最近非常火的一个概念,其实它的来源或者内生的原因也很简单,今天IT系统数据中心已经复杂到非常麻烦的程度,任何一个运营商的机房,任何一个银行的数据中心要想成功的维护它,你可以算算你的维护团队有多少人,如果要成功维护一个数据中心需要多少种认证,事实上我们在浙江移动、江苏电信几个单位那儿统计过这件事,绝对是一百家,需要有一百多种认证,这个细分拆开来看其实一百多种认证还不够,还需要更多的。

今天很多大型数据中心维护已经分成两波,一波管维护一波管架构。事实上今天一上午各位介绍很多新潮前沿的技术,包括前几年出现虚拟化分布式软件定义等等,增加灵活性扩展性等等,但是它同时让你基础架构层次会更多,让你基础架构系统里边的关系会更复杂,维护一个今天的数据中心基础架构变得更难以把控,所以有人开玩笑像亚马逊的数据中心需要8000多名博士后才能成功运营,这个也不算过分。

那么我今天要介绍的融合基础架构,实际上就是说把整个基础架构层面就是说应用逻辑除外,你的基础支撑系统包括数据库包括操作系统等等,这些基础架构层面的东西尽可能做纵向压缩,同时做横向拓展,达到一个效果把下边复杂部分压缩下去,给上边业务逻辑腾出更多空间。事实上在我们这种一体机上面它所有硬件都是通用的硬件,同时它又运作预先整合预先优化,使得整个性能可以充分发挥,匹配度能够发挥更多,我举一个例子,我们像双层架构有计算节点,存储节点的融合系统。但是这里边有些小细节东西当存储节点多了,计算节点通道数量会相应增加。

我们知道一些个友商也提供预整合系统,但是它不去提供太多的灵活性只提供固定几个规格,2+3的规格,4+7的规格等等,这样规格背后的原因其实不光是它一个厂商比较灵活的调配,我们通过自己技术的积累,我们提供足够灵活性同时能够做到部件级整合和全系统的资源匹配,我们具体这种产品基本分成三种系列,我们对基础架构的理解就是说从用户应有来讲,它有三个基本应用场景,这是我们一些应用案例,大家可以看到左边这块是我们跟惠普(英文)加上XP24000,灰色是时间,红色是我们数据库一体机最小规格在同样节点上面,惠普(英文)和我们跑的都是(英文)数据库,下边一个右边这个是IBM的一个,大家会看到整个性能的差别还是非常非常明显的,几乎在每一个业务领域所有场景都有加速。

今天的内容我的硬件部分就是我的一体机,作为一个融合系统,我们今天也有幸请到非常深入的合作伙伴南大通用(音译)下面部分请黄东旭黄总给大家继续介绍。下面是黄总演讲内容:

黄总抽取幸运儿

非常感谢董总,我是来自于南大通用的,今天非常荣幸有这样机会谈一下我们对融合架构的看法,我们南大通用主要从事数据库产品研发和销售。我们一款主打产品就是GBASE8A列寸MPP数据库,首先来调整一下我们的产品,我们产品叫做GBASE8A MPP Cluster,为超大规模数据提供高性价比通用平台,下面是几个特点和特性,集群的扁平架构没有主节点,基于列存储面向分析场景,高动态的扩展能力可以横向扩展到几百个节点,管理的数据量达到TB到PB级。高可靠性我们有自己的高可用机制,采用安全组机制来保证系统的高可用。并且面向文本数据我们推出自己检索的功能。

接下来给大家看一下GBASE8A的应用场景,这是我们GBASE8A面向不同行业目标的一些典型的场景我基本上给它归为四大类,第一个是海量数据查询分析,面向互联网金融电信等等作为分析库PB级数据支撑能力,一般来讲实现这种数据的经营分析类的应用或者报表的应用。第二类是对数据仓库的支撑,这种百PB级的支撑能力,我对于数据按层级进行汇总,所以说我们可以很好支撑这种百亿或者达到万亿级多表操作。

第三个场景是查询对宽表分析的场景,对上千列宽表进行任意查询,由用户指定查询条件。最后一个是基于心型和雪花模型多维分析,这是我们GBASE8A几大应用场景。典型案例,像电信、金融等我们有一些合作伙伴。目标客户除了我们四大行业,除了电信、安全、政企、金融,我们把它总结为经营类、管理类、监督类、专业类。这就是我们四大行业以及四类应用。在我前面提到那几大应用场景中我在做过的项目中,经常遇到IO性能的瓶颈,我们有自己性能分析的工具,我们可以准确定位到性能瓶颈具体在哪里。

我们发现基本上在四大场景中,绝大多数面临的性能瓶颈主要是IO的瓶颈,包括网络与磁盘的IO,比如说最典型数据仓库的场景,心型的数据模型对于多表关联操作,分组操作都面向不同程度磁盘IO的瓶颈,比如说面向多表关联的时候我需要对大表或者小表做全表的扫描,如果是数据库集群涉及到数据在集群的流动,比如说汇总的时候做这种分组的时候我们需要将临时数据不断的写入磁盘,汇总需要从磁盘当中读取临时文件。这种硬件IO瓶颈作为软件是无法去跨越的,但是幸运的是现在已经有一些新的硬件技术来极大的拓宽IO的吞吐,现在有业界最快的互联网络,极大拓宽在集群节点间的IO通道,分布式存储的技术,去除传统固有IO瓶颈。并且SSD作为主存的使用也提高了数据吞吐一个效率。我们如果做一体化存储的话,可以实现IO在不同盘自动的附载,我们软件不需要考虑这方面内容,避免过热的磁盘,并且同时可以完成在平台层面磁盘间故障的切换。

新的这种硬件技术当然也促发架构演进,传统数据库加小型机加磁盘阵列在架构上很难去延续,并且基于SMP架构它的扩展能力已经接近上线无法满足大环境下一些应用特点的需求的,因此这种数据库一体机融合架构它的优势就显示出来了,包括这种MPP硬性数据库,这些新的硬件技术都非常有利于我们在应用当中对于数据库优化的时候来消除性能的一个瓶颈。从市场角度传统的这种软件和硬件分离的方式参与市场竞争,它有一些弊端,比如说我们面对不同产品厂家是非常多的,面向市场竞争的时候缺乏这种竞争力,并且最重要是软件和硬件它的兼容性这是很大一个问题,并且对于资源的优化利用程度是非常低的。因此作为我们数据库厂商非常愿意去推出数据库一体机的这种概念,这种概念它相对于细分市场我们会专门做软硬件专门的优化,应对一些细分的是藏,这种差异化的战略提高整个市场的竞争水平,并且对于系统级整体调优,对于系统资源优化利用率提高系统优化也是有帮助的。我们GBASE8A希望提出的这种数据库一体机是一体服务器加上MPP(英文)数据库这种融合的架构,当然整个架构当中预集成预安装GBASE8A数据库提供统一的管理,并且进行这种软件和硬件深度优化一个基础,这样的话就可以使我们的客户在繁重的IT维护当中解脱出来,把精力集中在核心业务,他们自己的核心业务上。现在我们已经跟董总天玑数据这边正在进行一体机的一个探讨,我们希望使用一体机软硬结合的一种方式最大性能发挥我们数据库本身一个作用,我们的目标是推出简单灵活高性能,并且高性价比软硬整体的解决方案。以上就是我今天汇报的内容,如果大家对我们产品感兴趣可以会后找我一起交流,谢谢大家。