董唯元:OpenStack野心太大 超融合存在伪命题

近日,由DOIT、存储在线和易会联合主办的“2015中国存储峰会”在北京举行。作为中国存储界有影响力的年度行业盛会,峰会以“把握数据经济,重塑商业变革”为主题,吸引了上百位存储界的顶级学者专家、数百位产业精英和企业用户出席。

在当天下午举行的“超融合分论坛”,上海天玑数据技术有限公司总经理董唯元吐槽了当前超融合领域中的一些伪命题,如Scale-out与Scale -up,共享式集群与非共享集群,中心元数据与DHT无中心等等。

在谈到互联网基础架构理念时,他对OpenStack进行了批判,他说:“很多人是OpenStack的拥护者。但我觉得OpenStack野心特别大,框架特别大,因为专注度不够,所以,始终成熟稳定不下来。”

半年前,董唯元跟硅谷某一大牛谈起OpenStack,那些人直接就是“呵呵”,很多人都觉得它是失败。但是,OpenStack在国内还是很有生命力的,因为国内有广泛的定制化需求。

董唯元表示,这种野心很大,企图涵盖所有需求、一统天下的架构实际上非常危险。因为移动互联网带来应用的多样化,大于传统PC的那些需求。

\

以下为演讲实录。

董唯元:感谢大家,接下来这一段时间,就给大家介绍一下我们的理念,这个场合我是来吐槽的,顺便做一下广告。

首先,互联网碾压一切,不仅我们搞技术的,不仅搞数据中心的,搞金融应用的都能感受这一点。传统数据中心建设,传统的业务系统的支撑也在遭受着这种碾压。道理自然也是很简单。大家都看到,“双11”1天900多亿交易额,今年没有人再怀疑这个事情了。在两年以前,去年交易额过500亿的时候,还有很多的人怀疑,这个不可能, 24小时500多亿不可能。如果传统的架构理念去感受、去预估,确实是有很多做不到的事情,但是互联网可以做到。

新业务发展,让互联网真实的弹性的能力、快速的能力、迭代、灵活性,展现在传统业务面前,传统业务发现自己过时了。曾经,某一些传统用户数据中心负责人谈起互联网建设模式的时候,都是很不屑地讲:“我们是正经单位,我们是跑正经业务的。”意思就是说那些东西不正经。今天他们的态度180度转弯,还要学习互联网的玩法,甚至互联网淘汰的东西他们都是当宝贝抓在手里面。

在这种新的大背景之下,互联网所有东西都是好的。Linux是开放的,Unix是不开放的;Scale-out取代了Scale –up;用横向扩展取代纵向扩展;非共享集群一定好过共享集群。原来集群都是共享式的,都是共享同样一个数据,现在都是非共享的理念,非共享就是把集群做的更大,这个是一个先进的理念。还有分布式存储,无中心,无元数据存储……

整个互联网的技术体系也好,开源世界也好,对于传统业务数据中心建设的人来说,整体态度是什么?就是养蚕人对于蚕茧的态度。我们以自己的方式使用它,把它织成我们需要的衣服穿在身上,而不是作茧自缚。互联网怎么用这些技术,跟传统业务怎么用这些技术是不一样的。我们真正需要做的不是这种作茧自缚。
\

说一下细节一点的内容。比如说Scale-out跟Scale-up之争,这个似乎是成了定论了,所有厂商都说Scale-out先进,Scale-up代表落后。但是,在某一些特定场景下或者针对特定应用,一定需要那么多扩展性吗?这是一个我要吐槽的地方,如果最多5个机器就能满足你的需求,你还需要一个Scale-out架构吗?您不觉得搬一个机器,配负载均衡,这一大堆真的就更简单吗?您就加2个内存,加一点CPU,可以复杂到哪里去?

Scale-up真的就是落后?是说整个体系有天花板,这个逻辑单点有天花板、有上限。而且,在可预见的未来,看到业务冲到上线去,当业务依赖于系统架构的时候、业务超过所可以承载的上限的时候,你就没有支撑点了。这个是Scale-up很麻烦的地方,但是您的业务其实远达不到这个天花板的时候,它明显需要一个更简单的一个扩展方式。为什么一定要out呢?所以,这个是我要吐槽的,并不是所有的地方,所有的场景,所有的应用下面都是Scale-out更好,很多的传统业务不见得需要那么多横向扩展能力。

“去IOE“的时候,如果没有其他方面的补偿的能力,又不想损失可靠性、性能或者其他东西的话,其实我看到的很多传统业务在升级扩展过程当中,”去I“、”去E“之后,”O“还是要保留的。所有大数据的家族体系都是拉出来,加在一起也没有办法替代,这个事情这么多年业界生态也好,形成了这样一个局面。

DHT,听上去挺高大上,动态哈西表或者分布式哈西表,就是一个技术,这个技术就是让一个分布式系统(主要是存储系统)没有中心元数据。传统的都是要有元数据服务器,相当于是整个集群里面所有服务节点的一个中心目录。有了DHT以后,大家觉得这是一个未来的理念,非常酷,确实是这样的。

事实上,任何技术在这个方面先进了,一定在另一个方面是落后的。DHT这种技术说白了,就是回避了到元服务器查找的过程,他自己要做计算,替代元数据查找过程。这个过程性能有可能会提升,前提就是计算不太复杂,再一个集群规模就是大于原来的基于元数据的。这个计算的额外附加代价到底多大?所以,并不是说DHT一定好过基于元数据服务器,里面还会有一些隐藏的问题,如果处理不好,可能还不如元数据服务器。

互联网是营养非常丰富的宝库,里面有很多开源的东西,我们应该去借鉴它的精神,但是一定不是简单的拿来就用。我刚刚举了一个蚕茧跟蚕丝的关系。有一些厂商只有一个产品的时候,他觉得所有问题都是钉子。我们在对待产品和适用场景的时候也是要有这个态度:从应用需求出发,从解决问题的场景出发,而不是觉得什么工具都是好。
\

在座很多人是OpenStack的拥护者,我一直对OpenStack不是很乐观。我觉得OpenStack野心特别大,框架特别大,但是因为专注度不够,所以始终成熟稳定不了。

半年前,我跟硅谷某一大牛谈起这个事情,那些人直接就是“呵呵”,很多人都觉得它是失败。但是,OpenStack在国内还是很有生命力的,因为国内有广泛的定制化需求。这种野心很大,企图涵盖所有需求、一统天下的架构实际上非常危险,因为移动互联网带来应用的多样化,大于传统PC的那些需求。

今天有很多做超融合的中心,就是这样一个架构,就是这样一个Box,数据中心都是靠这个BOX。但是装满了,剩下就是软件的事情,这个就是软件定义。

软件可以定义所有的东西,不管是什么。硬件都是一样的,就是靠软件区隔开来,这个是互联网毒害,这个不是互联网精髓。互联网业务相对于传统业务来说永远是单一的,淘宝,百度,主体业务是单一的,造成了基础架构的需求、硬件需求、可靠性需求,都是相对来说单一的。所以,是可以一个砖块铺数据中心。

但是,银行数据中心、政府数据中心,业务实在太复杂了,各种各样的业务,各种各样的应用。你可以用最高标准把最高东西铺一遍,而不是简单的一个砖块铺所有的数据中心。

我们在创业阶段,一下子推出三个产品系列,三个系列里面再分7个细节产品型号。为什么这么做?就是因为我们觉得用户需求是各种各样的,我们是站在互联网先进的技术理念和传统的用户需求中间,我们知道传统用户需求的痛点,也知道先进互联网理念和开源世界一些先进的经验。我们针对不同的场景,一些不同典型场景有三个大的产品系列,有针对虚拟化私有云的产品,也是有面向核心关键业务的,还有替代传统存储架构的产品。
\

这三个产品里面,又根据不同的场景和不同的特性再划分不同的细节。核心关键数据场景下面又有V系列、H系列等等,面向不同的场景,不同的需求。

海量存储也是一样的,我们有块级,有文件级,甚至还有支撑传统架构的传统的产品。

虚拟化这个平台,在我们看来很快将会成为云的底层引擎之一。说白一点,如果将来数据中心是个大机器,虚拟化将是中间一个小驱动。这个小驱动不是不可替代,很快就是有一些新技术替代它。事实上,今年双11的时候我们跟浙江移动联合搞了一个整点快速促销的活动,看了一下我们这个系统是不是可以承载一个快速的高并发,测试下来发现什么?灵活性也好,弹性部署也好,容器技术在这方面的能力远大于虚拟化。

VM的灵活性只是比物理部署的灵活性高了一点点,如果我们考虑到移动互联年代,可能这个业务压力增长是原来的千倍、万倍的时候,VM技术是不可能提供这个支撑的。在这些新的技术推动下,我们觉得整个未来的云,真正需要的就是上面的跟应用更相关、跟业务更相关的一些高层管理,不是资源部署资源管理。

从业务逻辑出发,你有一个ERP系统,这个对应到多少数据库?选择什么操作系统?是选择虚机?或者用容器?用物理机?后面这一系列下来就是一整个模板,这个模板是什么?是以业务为核心的一个资源模板。这个都是业务支撑,以这种模板模式管理整个私有云,我们叫做服务目录化,这个服务目录化将存在我们未来私有云解决方案里面。

所以,这个是我们跟其他的超融合厂商的一个主要区别。
\

我这个里面有一个图,大概介绍一下这些产品系列所覆盖的不同领域。这个是一个传统数据中心,基本上都是有关键业务跑在这个服务器上面,还有一些跑在虚拟化平台上面,还有一些新兴业务,比如说数据挖掘,还有一些新兴业务,尝试性的、测试性能等等。我们的产品和其它产品分别是对应着核心关键业务和周边业务,就是两大方向。我们不是去革新架构的,有一些用户系统规模要求没有那么高,SAN架构对他来说还是不错的。还有一个全闪存传统架构的产品,是在保留系统架构前提下,提高读写性能的一个产品。

谢谢大家。