张广彬:软件定义存储与超融合系统

主题为“掌控数据经济,重塑商业价值”2014年第十届中国存储峰会今天在北京隆重上演,本次大会共邀请了16位顶尖第三方嘉宾,数十位专家,带来了35场前瞻性演讲+2场圆桌讨论,并首次推出硅谷创始人访谈和存储夜宴活动!

今天我们有幸邀请到七位嘉宾来到软件定义与数据中心论坛:数据价值,一触即发!软件定义这个概念之所以火热是因为用户希望能够更加高效、自动化的去控制、管理和使用各种IT资源,而无需花费太多精力在硬件层面。软件定义存储的概念已经遍地开花,但各大存储厂商对软件定义存储的理解各不相同。

第三个演讲人是数据中心分析师兼启事录创始人张广彬先生,给我们带来了主题演讲《软件定义存储与超融合系统》,是本论坛的第一位演讲嘉宾,以下是现场演讲内容实录:

数据中心分析师兼启事录创始人 张广彬 主题演讲《软件定义存储与超融合系统》

大家下午好,很荣幸能有机会跟大家分享我对软件定义存储的一些看法,刚才说的标题是软件存储和超融合系统,我本来是想讲这些,后来光软件存储就差不多半个小时就不够了,我决定先把软件存储它来讲好,所以我这个标题看起来好像有点乱,就是软件存储三种Style,大尺度是从整个数据中心层面如何看待软件定义存储。

那在这里边先做一个为什么叫公益广告,其实这里面软件存储我们在今年年初的时候两位同事写过硬件重构和软件定义的报告,它主要是说为了说是用来作为例证说明我们看到了这个趋势,那么这个过程并没有向任何人收取费用报告本身也是免费的,现在大家如果能记住这个网址也可以下载,如果记不住我也可以发给大家,那我要回来说一句,其实我们这里软件定义是很重要一个部分,但是经过这一年的研究我们对它又有一些新的看法,所以这等于说在去年报告基础上我们加入我们现在新的一些观点。

那在IT上有一些著名的人他们都说过一些预言,但是后来跟不上形势的发展,普遍流传IBM老沃森在1943年说的,应该没有任何证据证明是他在那个时间说的那句话,但是这个话对我们今天看来可能很有启发,有可能这个世界可能5台计算机就够了。那我们知道现在的话这个世界不仅仅5台计算机都不好满足这个要求,计算机都卖到哪里呢,存量最大的就是谷歌,微软去年宣布服务器超过100万台,微软在最大数据中心当然不是单体的建筑就有60万台服务器,当然这个还没有经过进一步的证实。

AWS按照公司规定不能直接说它有多少台服务器但是它在上个月它给出这么一个数字,就是说AWS每个数据中心是在5万到8万台之间,它就是超过一百万台了,这个在中国还不适用,那在宁夏建的数据中心也还没有建成,不排除AWS在宁夏数据中心建成之前,可能在上海又开几个数据中心,但是据这个消息说如果北京上海宁夏都开设中心也不是一个可行区可能是三个可行区。其实云计算使用的模式跟原来大机时代其实有点像,大机时代终端只负责显示。虽然现在一部新的智能手机运算能力比一台大机还强,云计算任务是在云端完成的,其实终端主要是显示一些交互的这些任务。

当然我不是要把大机和云计算对立起来,严格上来说当然用大机也可以做云计算这个没有任何问题,但是现在一提到云计算它是一个分布式的,另外一方面我引用一个图,我还是描述一下,就是业内大牛打一个比喻,以前我们的IT对待硬件的模式是宠物模式,比如养小猫养几只病了会带它到医院,现在云计算这个模式就是说它是一种牧场模式,你在牧场里面养着几千上万头羊有病了也不会那么呵护,然后如果出个比较严重问题就把它杀掉就算了,也不会为它感到很痛苦,听起来很残酷其实就是这样的。实际上这就带来两种不同的模式,就是说我们通常大家默认说的云计算,那它第一因为我从购置成本来讲不会买很昂贵的硬件,另外我很在乎运维,运维成本更高,因此我不可能就说我一个人要管几万台机器的时候,不可能每个机器出一个问题就把它什么什么部件替换。

那接下来我们可以看当然了如果严格从计算意义来讲,将来世界上真的有可能5朵云就能满足您的需求,我只说有可能,其实这个是我瞎画的,IBM是旧时代领头羊的代表,当然我个人认为不可能将来只有五朵云的,当然我们站在这个角度来看待五朵云和5台机器有一些共性的地方。其实软件定义,为什么要软件定义,我这里不用详细的阐述一下,其实你到了一定规模以后软件定义你就必然要用软件要用自动化来维护你的这个规模,因为我们比如说那你首先要做的一个就是把软件和具体的硬件解除耦合,我们很多人都用过服务器虚拟化,它有一个好处就是说你如果这台机器出了问题你可以直接把上面虚机相耦,如果原来在物理机时代就会很麻烦,像硬件软件抽象隔离才能做很多自动化隔离的工作。

那回到软件定义存储这个角度来说,那实际上软件定义存储这个概念,现在大家比较公认的就是说控制层面,先从SND软件定义网络过来的,这点对于控制和数据分离这点业内没有什么大的异议了,是不是硬件一定要和软件分离,硬件和软件要没有关系,至少目前大家还是分为几个流派,其实这里大家可以看到控制层面,这是IBM划的一个定义我认为是比较符合我们的想法,我们可以重点看数据平面,数据平面它这里说的硬件比如说我们从几个角度来说比如说惠普等等这些软件和硬件比较耦合的。实际上在存储的领域控制平面和数据平面相分离是这两年才提出来的,以前控制平面和数据平面是不分的,分离了可以对上面的云操作系统,那数据平面我们可以看到其实这下面分的三类跟前面分的三类是一样的,尤其是我们这两种它代表新的事例和旧的事例不同的看法。

当然软件来解决硬件问题说法不是很严谨,实际上从差不多五六年前存储行业形势就已经很明显了,以前存储行业大家从硬件这种基础的,实际上它做到一定程度以后,其实我们就看到软硬件,以前我们用计算能力实现高层的软件功能,以前硬件来实现的事情,也可以用软件来实现。比如说传统的硬件我们说不管是服务器也好,还是存储也好,其实他们都是所谓可用模式,这个东西尽量不要容易坏,把它做成高可用的,从终端开始双控制器就是必须的配,首先双控制器这个东西就是硬的依赖,另外一个你每一个硬盘或者SSD也好它必须要有两个访问路径,同时接到两个控制器上,所以最早的光纤盘是双端口的,后来大家用大容量低段速的盘,其实它仍然要有SAS,也是符合双端口要求,高可用我们很大程度要依赖硬件。

你实际上如果想拓展超过8个节点的话想要突破硬件限制是很难的。这点如果你是新兴的公司,你创业打算做存储公司,你肯定标准的第一是这些老公司他们的东西卖的很贵,另外一个你的门槛又要低一些,因为相对来说硬件创业的门槛比软件的门槛要高很多,你要找很多硬件专业人才,当然我不是说门槛高低跟技术含量是两回事,这由让我想起老罗谁的手机来,我们可以看到老罗的没有背景的人,他还是能够找人做出一个(英文)来,这个软件不管怎么说能做出来,但就卡在硬件上了,硬件的门槛实在太高了,如果换一个角度说有一个通用的硬件平台,是不是老罗的手机现在已经卖的很不错了,实际可以看到标准化一点,当然手机市场标准化没有那么高。

但是做成一体机指的商业模式并不代表说软件和硬件不可分离,我们在刚提的报告里面,它完全可以把软件和硬件分开来,它跟戴尔达成OEM的协议,以戴尔的品牌来卖超融合系统,左边都是新的事例。还是在成熟度和面向市场还是有区别的,这个就不展开了。在存储市场上软件定义存储这个词是由EMC在去年正式提出来的,我就说主流厂商,其实IBM和惠普更早进入软件定义存储通过收购,为什么这个词被EMC先叫响的呢,EMC是存储最善于忽悠的公司,包括大数据也是EMC最早提出来的,但仅仅是因为这个吗,显然不是。因为IBM和惠普也不傻,他们固然收购这个产品有业务线这会对现有产品造成冲击,首先是自己颠覆了。

这里就是体现出来另外一个问题了,如果你是成名的,你有很多存储遗憾的这些公司,你怎么来宣传软件定义存储呢,这也是为什么control Plane和Data Plane分离,我们知道存储是共享的,共享存储它的优点更高,但是你一台一台存储之间又形成了孤岛,也就是说你在小的范围看共享存储,你在数据中心看它们又是割裂的,能不能连成统一存储池,用户当然希望这样,但是厂商它只能说部分是这样的想法,因为大家存储之间是异构的,要组一个集群很麻烦,这些存储诞生在大机和小机横行的时代,所以大家互相都不开放,在数据中心我们需要来了解我们存储的状况,但是对不起你可以看,你不能改,你不能分配存储因为你不知道每家的细节,那从这点存储网络工业协会一直致力于去推动这点,但是它也推不动,这是由于存储厂商来做的,其实大家虽然有协会实际上大家用的诚意也不大。

另外一个办法就是干脆我用,比如说IBM想我出一个设备把你们所有存储设备都管起来,那这样的话大家就有存储虚拟化这样的产品,服务器虚拟化可以成功,它是因为X86服务器足够开放,你现在有没有(英文)能够通吃大机和小机和X86,IBM有但是IBM不开放给你,存储面临就是这种困境,你放一个虚拟化的设备在主机层存储之间,只能使用下面存储标准化的功能,只能把它当做大的硬盘来用,下面举的例子都是很贵很贵的存储,但你只能把它当做硬盘来用,存储虚拟化放在主机和存储之间它自己也会有一个问题。

实际上我们来看在硬盘这个行业不存在这个问题,如果我们放在数据中心层面来说,有了云的操作系统,那实际上下面所有这些硬盘,这些存储都可以当做像硬盘那样看待,实际上这个问题大家互相不服,破与操作系统的压力可以向上汇报,这就是现在软件定义存储大家愿意做的事情,我们去向上北向向下是南向,传播它的命令我再转给下面Data盘,把现有的存储产品全都纳入到云的环境里面去。

最后一种就是云,那我们可以看到其实这个例子很好的体现了就说当存储功能完全与硬件无关的时候我们可以做到什么,实际上就是把它控制器软件装到AWS一个虚机里面,那你只有控制器存储空间由谁来提供,由存储介质云中的块存储服务,EMC也可以做到这点,好像现在没有看到产品,AWS它有云计算领域一流的S3,快存储它也有,但它没有文件存储,我们大量用户习惯文件存储,如果让企业用户上云可能要提供文件的这种服务,第二一个还要更多存储功能,其实总的来说存储厂商把自己产品功能搬上云你就可以去满足企业级用户上云的需求,这个事情对于存储厂商本身是不是一件好事,我觉得恐怕不是很乐观,这也体现出来面对云的大潮你不爽的话无论如何不是一个好的选择。

新兴厂商在中间我先从传统厂商挖墙脚开始,我用廉价的硬件和我的软件,我去获得一部分市场,然后等我具有一定的占有率以后我想跟云的OS去结合,这种传统厂商收购很多新兴的做软件定义存储的厂商,那新兴的厂商从上往下走,就是说我们要看用户的需求,我相信2015年我们在软件定义存储这方面能看到更多的期待,一定会超过我个人的想象力,谢谢大家。