Dell谈SAN 2.0:应对虚拟化和容灾挑战

网络存储(SAN)对于大多数在存储业内已经不是一个新鲜的词汇,一般说来,SAN架构代表了存储集中化、网络化趋势,在提高整体系统的性能、扩展性以及管理性方面有着突出的优势。但是传统的SAN架构真的尽善尽美了么?SAN的未来将走向何方?近日我们视频对话了Dell公司的存储技术总监许良谋先生,为大家解读Dell SAN 2.0的理念。

虚拟化应用对存储的挑战

问:其实今天在主机当中还有一个趋势,就是说现在主机端的这种虚拟化的应用,它是非常广泛,那么虚拟化其实应该说对后端的存储业带来一些挑战,然后您能谈一下虚拟化对后边的存储对应用的挑战,Dell SAN2.0的模式会怎么样去应付这种挑战吗?

许良谋:我们大家无论作为IT厂商还是用户,有一点不能忽略,一些新技术被提出来的时候,它绝对有把握去解决一些现有或者是老的问题。但是大家千万不要低估,新的技术、新的方法带来的新的问题。

实际上很多我们在国外的客户,包括一些中国的客户,开始的时候觉得主机虚拟化太好了,而且CPU怎么能够被虚拟化,内存的网卡如何进行虚拟化,用户被一些新的技术吸引的太深,但是有一些旧问题,应该要提出来的问题没有去提出来,所以有的时候在实施之后,你像吃了一个闷亏一样。

我记得在上次武汉的一个大会里面,我们有一帮客户已经吃了闷亏了,说我们不要谈这些花招,我们要谈的是实际的使用,还有实际到底有哪些问题,我们必须要提出来,而且真正去面对。

我举一个例子,以前在所有的数据或者是应用里面,如果我的信息、我的数据还是在主机里面,而我的存储是没有达到最新的数据的话,万一数据中心掉电,所有的主机都不是5个9的数据安全设计,那么就会造成数据丢失。

但是存储都是5个9的数据安全设计,在掉电的时候主机上的数据没了,但是存储系统还能够保存。但是万一数据还在主机的话,那我们还是会丢数据。以前在主机虚拟化技术还没出来之前,很多人都对这方面做了很多的研究,例如oracle,怎样能够保存数据库信息的安全,oracle和很多数据库都有这种技术,当你的应用吐出信息之后,它可能会被文件系统卡住了,因为文件系统有它自己的一些缓冲期,但是我们已经掌握了一些技术,如果数据被文件系统挡住的话,我们也有办法叫文件系统吐出来,而文件系统吐出来之后,如果被操作系统虚拟内卡住的话,我们也可以保护起来。

但是,今天很多人在掌握了叫应用、文件系统和主机吐出数据来的技术的情况下,他们忘记了一件事情,今天大家都住在一个小的虚拟主机里面,底层有一个全新的架构,叫做虚拟主机,虚拟主机有一个全新的缓存的构架,而且大家可能忽略了一点,以前一台主机可能就是4G、8G已经很厉害了,但是今天在主机虚拟化的这些设备,有一些主机一开始可以配到256G的内存,所以一台虚拟化主机开始的时候,哪怕是VMware等等,开机之后,虚拟主机的操作系统,就会把整个512G还是32G全部拿为它自己的一个缓存。

今天如果我们看主机虚拟化技术,我们是否掌握了让它的内存缓冲吐数据呢?有的是没有,或者是根本太难,完全没办法操作,所以在采用主机虚拟化技术的条件下,我们每一天都在增加一个定时炸弹,万一掉电,万一有错的时候,因为数据没有保护,所以会有丢数据的风险。

SAN2.0中我们提出来,主机虚拟化技术里面,我们怎么样能够在主机虚拟化的大趋势前提下,还能够保证数据的安全,这是第一点一定要做到的,不然的话,这个数据丢的时候大家都受不了,别说32G,别说512G,一个企业丢1G的数据的时候都已经很可怕了,一般的数据库1G已经很多很多数据,这已经是上万、上几十万客户的信息了。然后第二,我们也希望在主机虚拟化里面,真正把带宽的问题解决好。

很多人都误解了一件事情,认为我后面有4G的带宽,8G带宽,我这个带宽就已经很足够了,但是事实上,我用一个很简单的例子,如果今天我开一个餐厅,我为了让我前面做的客户,能够很快拿到他们想要吃的菜,所以在他们和厨房之间我建了三个窗口,这样我就能够保证点菜、出菜的速度很快,但是里面如果只有一个厨师,这三个门形同虚设。

问:他会供应不上。

许良谋:对,可能更好的方式是我只有两个门,但是后面是三个厨师,甚至我一个门,后面有5个厨师,这种方式就更好,所以在主机虚拟化里面,实际上很多人没看到一点就是说,主机虚拟化是VMware的一个应用,就是随即乱丢东西的一个方式,所以它绝对要求你的阵列有充足的灵活性,而且你的吞吐力一定要强,不然的话,这个带宽就像刚才说的,你三个门口,你的带宽很宽,但是真正做事的很少,所以没有办法把整个虚拟化的优势体现出来。

今天,主机虚拟化在前端,必须配合好良好的后端虚拟化,我们才能够做到一条龙的虚拟化的技术,所以这是我们觉得SAN2.0的理念之下,能够帮客户解决的一些问题。

第一点再说一下,它一定要解决主机虚拟化不能够丢数据的可能性,第二点它一定要有后端强大的力量去配合前端,让我们前端能够跑的讯息更多,而且我们在做两大主机切割的时候,我们这些带宽也能够很轻松的切割,从一台到另外一台。

今天很可惜,在SAN1.0传统的结构下实际上是没有可能发生的,所以有一些客户说,奇怪我怎么用了三个月之后,这个东西慢了,但是又特别难去排错,因为后端如果全部用僵硬的方式去设计出来的话,实际上绝对没有可能去配合前端的。所以SAN2.0对等的技术就是,我们前端发生变化,我们后端也必须动态的去调配,而且这种做法不能带来任何停机停用。

对等存储的横向扩展

问:我总结一下您刚才谈到的主机虚拟化给后端存储带来的挑战,可能有三方面,一方面是数据的安全性,另外一方面是带宽上的挑战,还有一方面我总结起来应该是业务上的灵活性,那我们想问一下在戴尔所有的存储产品中,包括Equallogic的产品其实在业界上有很好的声誉,它究竟是怎么样来保证这三方面安全性、带宽还有灵活性的问题呢?

许良谋:好的,实际上所有的东西都以一个很简单的概念开始,例如今天,有的时候他们会说,你一台磁盘阵列上为什么再加一台磁盘阵列?那么实际上,加进来的磁盘阵列不仅仅能够在线的扩充容量,而且这两台机器很快就开始合作起来去做同一件事情,把事情做的更好,就是1+1=2的效果,这其实很容易理解。比如说今天我拿两个交换机这样做就绝对不会惊讶,用一条网线把这个交换机连了之后,两个交换机就挪到同一个网络,咱们不可能觉得这个技术很神秘的。

问:交换机在今天这样做好象大家真的是习以为常的一个概念。

许良谋:但是在存储里面我们这么做,大家都觉得很惊讶,原因是什么呢,就是因为大家今天在做传统存储的时候,其实我们不难发现,这就是一个主从的技术,就是说所有的主机才能真正的享有掌控权,而所有的阵列都是以盘为中心,而如果我后面有很多台阵列,因为真正的掌控权是在主机,主机喜欢访问哪一台是主机决定,而存储既然是做一个仆人,仆人和仆人之间都不能聊天,而且不能互相切磋,怎么样去合作。

Equallogic这种SAN2.0对等技术里面我们做了一个很简单的事情,我们能够开始说,主机你不应该再来这个阵列了,因为这个端口我们看到太拥挤了,或者是一些主机本来不忙了,大家都在分享这个端口,但是现在其他的业务好象都堵在这里,作为一个对等技术来说,我们能够说主机麻烦你退出一下,而我觉得另外一个端口更适合你,或者是另外一个阵列更适合你,我们在存储方面大家都平等,主机你和我大家都是网络的好公民,我觉得我能够帮你的话,我就帮你,但是这种切割是不需要带来任何操作和停机停应用的。

自动化的流量管理与分配

问:我想问一下,有没有这种可能,因为传统存储通常有QOS的机制,它会优先保证一些应用的流量和带宽,那我们在Equallogic这种情况下,它如果需要两台阵列平等的去工作,对这种一些业务的优先级怎么样去做保证呢?

许良谋:很简单,QOS就是说怎么能够在做其他的事情的情况下,又能够保证我们的关键应用不被影响。实质上很多传统的技术,在做QOS的时候,都是用自己的角度去看QOS的,例如我可能是网络的提供商,所以我从网络的角度说我应该怎么去做QOS,但是事实上前端和后端是不是能够配合,这不是我的问题。或者另外一个供应商在后端说,我能够做到QOS,但是它和网络端的QOS没配合,所以事实上从前端到后端是不是真正能够发生,是无法保证的。在说QOS的时候,我们要看一个整体,从前端到中间网络层到后端,才真正能够做到端对端的QOS,或者是叫做良好的流量控制。

Equallogic实际上是延续了SAN2.0里面很简单的一个理念,一切以客户的使用为导向,就是说当我们在做这件应用,如果我们已经很明显看到有其他的应用在用,如果我们做一个决定说不要去理它,你就去抢资源,那大家不是双败吗。

Equallogic对任务的平衡就很简单,如果已经有其他人在用这个东西的时候,给它一些最基本的尊重好不好,让它完成它应该要做的事情,如果有非常着急的应用,管理系统决定必需马上做,我们也可以马上做,但是如果管理员没说马上做,我们可以慢慢的做,在不影响前端或者是网络之下,我们一样能够把这件事做好。

后端这种对等的技术,就是因为我们不只是只在一台去做事,而是以多台,类似重组的方式,你们帮我,我也能够帮你,用一个团队的精神去服务前端,所以才能真正把这个效果做出来。

问:我想应该说是Equallogic它是一种在整个网络负载均衡的一个技术,我想其实对于传统存储来说,可能有手动的方式,我带设定这个QOS,我可能会给一些高性能的应用,分配给它的更大的缓存和带宽,但是实际上在具体应用中间,它在系统中间跑的状态,我们可能并不一定真正的了解多,那么Equallogic可能用一种完全自动的方式,来自动监控这个流量是否过负载,如果过了负载我可能要分配,再从其他的地方找一些资源来操作这个应用。

许良谋:我举一个很简单的例子,以前我在博科的时候,在线的大客户,他们可能会说,厂家人你帮我过来调优,刚才说了必须要厂家人过来调优,我记得有的时候去到客户那里,就说好,我帮你调优,那他们就会把过去三个月六个月的信息流量全部给我看,然后我就会看,如果来这个信息流都是这样的话,我知道我可以设哪些参数,之后我就能够把它优化。

但是有的时候如果你坦白的问我,你说我这些设置进去之后,我怕不怕,担心不担心,实际上我是担心的,因为我知道虽然我这些设置是能够去优化它,但是我是要烧香拜佛的就一定要希望将来的数据流量和这个一模一样,不然的话我这个可能是害了它,因为这些都是静态的配置,都是很僵硬的,除非他每个星期都让我过去,我再重新设置。

但是这些人为的动作太多了,所以你刚才说Equallogic在SAN2.0里面,其中一个就是说,如果能帮客户能够简化存储之下,更好的自动化存储效果,如果能够负载均衡的话,因为电脑看的最清楚,应用是怎么用,那我们何必用人的方式去看某一刹那的东西呢,所以实际上我们可以让阵列或者SAN2.0这些东西,去让它做它应该要做的事情,动态的、均匀的分配,不需要人为的动作去干扰它,因为有的时候我们在进行人为的动作的时候,实际上我们也增加了人为的错误因素进去了。

问:而且当一切的操作变得自动化的时候,相信对用户来说这是一个非常简单的东西,他只要把它接入网络,那么所有的负载均衡都有后台的这些设备来自动完成。

许良谋:我们也知道,不是所有的客户都对自动化系统有百分之百的一个信心,所以在SAN2.0的对等技术里面,我们都说必须有全自动化、半自动化,或者是完全不自动的方式,就是说无论客户他的心态是在哪个阶层,可能他觉得我对于这种存储的人来管理,我觉得这种方式就比较踏实一点,没事,我们可以把自动化功能关掉,你觉得自己能够掌握这种技术,那没问题,绝对让你去做。

但是有一些中小企业,或者是在一些我们要考虑Oracle怎么优化,不想去考虑所有的优化,认为存储自动化不是更好吗,所以我们希望把优化的时间还给前端,优化的时间还给网络,而不是每天要跟整个的项目打交道。一个项目上来的时候可能三个月,存储可能要花百分之三四十的时间,我们觉得何必呢,如果能够五分钟之后做完了,那其他我们都能够在容量,其他的东西在做,应用也需要很多时间优化,系统也很多时间,网络还很多时间,时间还给他们,好一点,我们抛开存储,因为像刚才所说的,抛开存储的意思就是说,你的周末的时间,你的晚上的时间,你的家人的时间都全部摆在桌面说不好意思没有了。

SAN 2.0的经济效益

问:其实对于用户来说,使用简单化确实是所有用户对存储的一个梦寐以求的需求,在今天其实经济环境也有一些变化,比如说现在这种经济危机,确定应该说很多企业都能感受到这种经济危机带来一些压力,那么对于用户来说可能节约成本是他非常关注的一个问题,那么对于用户来说Dell什么技术能够帮助他们节约成本呢,比如像自动精简配置这种技术。

许良谋:我觉得这是一个很好的问题,而且这次金融海啸其实也影响了各个城市,而且我们也知道,实际上它对实体的经济有一定的影响,在这里有的时候你会看的很清楚,我们既然是做存储的厂家,而且我们是提供硬件,我们不会武断的说是一个软件公司,有的时候你在听一个存储公司说,明明是卖硬件的,但是它说它是软件公司的话,就是说小声一点的话,因为卖的软件都需要额外收钱。

今天我们看到这种方式,其实已经恶劣到怎么一个情况,已经恶劣到今天很多企业单位是没有办法去衡量我究竟需要多少成本?美国一家调研机构,对全球在美国有100家调研,他就说咱们这些CFO能不能够列出来你三个最讨厌的人在你公司,其中有一个一定是存储有关的,因为CFO都说,我每次到预算之后,没有一次你们是准的,存储没有一次预算是能够真正掌控的。

实际上我觉得这不是最终用户的问题,而是今天厂家,他们在想要怎么去挣这个钱的时候,他们想了很多招,很多招已经没有办法让客户掌握了,不仅是有软件个别的费用,还要有这种软件的使用费,还有软件的维护费等等,而且看你怎么用,不同用法还有不同的说法,而且我们看到另外一个更离谱的,他说哦,请问你有多少台主机要连,他开始要收你的主机的钱了。

在经济不好的情况下,Dell公司我们有一个特色,在每一次经济走下坡路的时候,就是大家更加能够掌握或者是明白,为什么Dell能够提供给他的价值更多的情况,就像你刚才所说的,自动精简配置,或者是我们超级的自动精简配置需要多少钱,我们觉得是你的东西就是你的,不应该有任何的可能性在这之上,再提出要收钱,或者是你说我要另外一些功能,我们觉得为什么人家要这些功能的时候,你每个都要去提说要钱要钱,你真正要钱的时候为什么不早说呢,都是用一种偷偷藏藏的方式。

所以我们这次在SAN2.0的对等处理之下,我们也大胆的提出一个要求,就是当你要这个东西的时候,我们会很痛苦的跟你说,这个东西是值多少钱,如果你觉得价值没那么高的话,你可能不一定买,但是如果你觉得它有价值的话,实际上买完之后再也不用付任何软件费或者软件维护费,全部功能马上激活,这些功能你说我不需要,那就不要去理它,而需要的时候都可以去做。

让容灾不再成为噩梦

问:就是说Equallogic所有软件的一些功能实现,多不会对用户涉及到额外的费用了。

许良谋:对,而且这种概念,有点像把钱存进银行一样,钱生出来的利息都是咱们自己的,实质上Equallogic这个产品技术一个优势就是说,我们不只是说现在你有多少功能,而这个硬件如果你拥有的时候,如果你有三年的维护费的时候,它有代表着未来三年有什么新的功能都是咱们的,不需要付任何的钱,直接可以掌握这种技术,就像刚才所说的,这个钱放在银行里面,原来的钱是你的,算的利息也是你的,所以在经济低迷的情况之下,我觉得客户有的时候,因为数据毕竟是保障,无论是经济好、经济不好,而且今年也是多灾的一年,有的时候一些客户如果说,我真的是想要做容灾,但是一做容灾就很害怕,因为太多人说这个容灾很贵很复杂,更可怕的是就算你有容灾用不了。

我们看到美国有一个调查,911之后,很可怕的一个性质,很多人在说,我有容灾,但是有接近75%的人都在说,我觉得灾难来的时候,我觉得咱们这个容灾是派不不上用场的,因为太复杂了,主战点的这种变化是容灾没办法追上的,而且很多容灾的方案又昂贵,又难操作,而且没有任何条件给客户演示、演练,所以真正灾难来的时候,大家希望好运,不然的话真的是没办法了。

所以我觉得在经济低迷之下,就算是容灾的需求,或者是就算中国有些客户要做多一点点容灾,可能说咱们这些站点,可能在北京、上海哪些都有,然后我们挑一个地点作为灾地区,我们也希望这些功能把神秘感拿掉、把复杂性拿掉、把昂贵的价钱拿掉之后,昂贵的价钱是什么意思,根本不收费之下你都能够拥有,我觉得这样才真正能够把容灾做出来,不然的话大家都还是停留在不敢用,那么复杂、那么贵,真正灾难来的时候大家都说怎么办,没办法,所以有的时候我们是希望,就是说很多客户已经有容灾,更多人是没有容灾,而更多人是卡在中间,我不知道怎么样,我们是希望能够帮到中间这些人,更加顺利的能够去做更高级的数据保护。

问:其实容灾心里对于中国企业来说确实是一个比较奢侈的一个东西,包括据我了解的很多银行地他们也只是因为政策反馈的压力要求,它必须去构建一个容灾中心,但是这个容灾中心是否能够真正投入使用,他们平时在这方面做的工作也比较少。

许良谋:而且很多我们也看到,以传统的SAN1.0的技术来说的话,其实很多的阵列或者是今天的存储,你不至于本身没有容灾的技术,但究竟有没有这个本事,实质上都没有的,实质上我们看到,大部分的SAN1.0的存储就是存储,顶多就是给你容量、给你带宽,但是你说我要做数据的保护,哎没问题,我有另外一个软件,买呀,我要做容灾,我有另外一个软件再买呀,但是实际上这些软件都是递加上去的,所以自己本身阵列没有发挥什么效果,所以说的难听点,都是叫补丁。所以真正容灾的效果如何,实质上都是叫对付。

我拿一个很简单的例子,容量虚拟化里面的自动精简配置,如果主机要用这个卷,我们又不知道派给它多少,我们可以虚拟出来,但是虚拟出来之后,如果又要把这个去到容灾地点,如果这些软件都是额外加进来的话,实质上就算你这里是精简配置,那里不是,然后这里改了之后那里没改,那里改了之后这里没改,因为都是两三个厂家做出来的,你不能够把它说这个容量平台也一样是一个数据保护平台。

当你看今天SAN2.0存储的时候,他们很多都是一体化的思维,就是说我不只是要做容量,我要做这种后端的虚拟化,而且我也是一个超级的数据保护平台,自身就已经做过了,你在这里喜欢自动精简配置机制吗,我保证那里也是自动精简配置卷,如果你这里不是自动精简配置卷,但是要省地方嘛,我那里也帮你自动换成自动精简配置卷,所以就变成容灾的地点不需要昂贵了,因为可能这里咱们的生产线有100TB,但是实际上真正的生产数据就5TB而已,其他的容量都是规划将来用的,那容灾呢,如果再没有先进技术去帮助之下,那这里买100TB那里也要100TB,但是在一个能够跨越长距离的自动精简配置,就是说你这里5TB,我那里买5TB多一点就行了,你这里再增加的时候,我那里再递加。所以你在做容灾的时候,容灾不是恶梦。

今天实质上有很多人,每年老板批了一个预算报表之后,实际上70%这些都是拿维护的,真正30%是做真正的业务、需求,我们觉得这些能够要改,实际上你70%应该是做一些创新的技术,当企业有这种优势的时候,给能够领先竞争对手获得一些经济效益,而不是所有的预算全部泡在维护费里面。

问:好的,今天我们听许良谋介绍了很多关于SAN2.0的理念,也是介绍了Dell对于整个存储未来的一个方向,我们也希望Dell的SAN2.0在现实生活中能够尽早实现,这样更多的用户,能够享受到SAN2.0给我们带来的便利和一种低成本的经济效果,那么最后还是非常感谢各位网友参加我们本期访谈,也谢谢许良谋先生。

许良谋:我需要补充的最后一句是,眼见为实,不要相信这种纸张的东西,实质上全国各地都有体验中心,如果大家有兴趣,各位网友都有兴趣的话,都可以到北京、上海,或者广州、成都、香港,不同的地方我们都有不同的体验中心,每个星期我们都可以让你操作,让你亲眼看到SAN2.0,而不是说越是这种天上的东西越降落不了,大家都看不到什么实际的东西,所以在这里我也很开心的谢谢各位网友,也谢谢今天这里的一个安排。