以“数据造化 智见未来”为主题的2013中国存储峰会今日在北京盛大开幕。作为一年一度的中国信息产业界领袖级会议,本次大会得到了中国软件行业协会、中国计算机学会存储技术专业委员会、武汉国家光电实验室和国防科技大学计算机学院的大力支持。共有10位第三方专家和23位业界领袖/专家出席峰会,并发表了25场极具前瞻性的主题演讲。Gartner和Forrester两家全球知名机构的分析师还与与会嘉宾就大数据浪潮下的存储进化与应对策略进行了两场高质量的高峰对话,现场吸引了超过千名参会嘉宾,给大家带来了丰盛的存储盛宴,再次引领中国存储产业发展的深度思考。
今年是DOIT正式成立十周年,也是中国存储峰会连续举办第九年。十年前成立DOIT传媒时,还没有Facebook、微博和微信,转眼十年过去了,互联网和IT技术都发生了翻天覆地的变化。也正在经历从传统互联网向移动互联网变革的过程,IT技术正在越来越融合,云计算、大数据的兴起,社交网络和海量数据的出现使传统企业IT架构越来越难以满足需求。
在下午云存储与数据保护分论坛中,Infortrend中国区产品经理李剑进行了主题为“审视云架构下基础存储发展方向”的演讲。高速奔跑多年的云, 最终的定义还是类属于应用范畴。抛开各种昙花一现或未真正落地的技术,基础架构还是以存储为基础向上发展。云中各领风骚的技术流派在回到应用范畴之后,必须审视基础架构中存储未来的改变会引起怎样的蝴蝶效应。
Infortrend中国区产品经理 李剑
以下为李剑演讲全文:
大家好!我是来自于Infortrend中国区的产品经理,我叫李剑,今天的会议主题其实丢给我的时候是怎么看云已经发展到今天,应该有五六年的历史了,然后作为一个存储厂商来讲,接触的最多的就是这些最前端的应用的这些合作伙伴,也包含了这些云的服务的合作伙伴。
给大家分享的主要是我们作为一个存储厂商在过往的五六年跟前端的云平台的厂商接触以后发现他们的一些疑虑点,或者整个市场的变化对于他们来讲为未来的一些期望或者一些抉择的点。首先对于云来讲,当时定义云架构的时候曾经有一个人跟我讲云很简单,就是拿一个无数的池子把水结合起来,再分享给很多小桶用。但是,对于前端最基础的应用来讲,云要支撑的还是跟我们日常生活密切相关的这些服务,不管公有云还是私有云,私有云可能更多是在我们的行业、企业,或者是一些固定的专有领域里面提供一些服务。所以,云最终还是要提供一个服务。那么,跟我们正常以前我们没有看到云架构之后我们做的都是企业应用的方案,比如企业的邮件系统,比如企业的ERP,比如企业的跨国的结算这些也是应用。对于应用来讲,它最终还是要分在两个层级上看,第一个层级是硬件,不管今天再厉害,再好的技术最终还是跑在硬件上面,以前我们讲的基于什么架构,其实是基于什么样的硬件架构,之后才产软件上面的东西。所以,把云架构回到最基础的应用架构来讲,还是在硬件和软件之上跑一个面对于前端的应用。这些基础的组件都是什么?计算、网络、存储。接下来就是在上面跑,你要构建那些平台,云平台,虚拟化,云操作系统,所以软件结合应用永远还是我们做应用的在看,或者对于我们存储厂商来讲我们看的更加真实一点的地方,就是基础要结合应用,和硬件、软件一起去跑。
那么,对于硬件最基础的平台来看,或者对于云的最基础的平台来看,我们发现有两个东西是这两年我们跟云平台的厂商在沟通的时候他们会不断提出来的。因为他们越来越发现一个问题,软件其实是只要定好硬件架构以后,通过模块化的方式无限期的可以扩展,不管云计算下面的软件,还是以前行业应用的软件,模块化的方式不会变,所以软件部分,不管你怎么做,做无限制的按需的扩展是很容易做到的。
问题在哪里?问题在硬件上面。硬件的发展以前我们说有一个摩尔定律,每18个月,芯片的制程会降一半,但是今天的基础硬件发展已经完全超过了摩尔定律,也许你今天规划一个硬件平台,不到两年又被另一个替代了。另外一个就是基础硬件的革新换代率太快了,我们之前一直在争论我们的光纤以后在数据中心可能慢慢会被IP替换掉,可是我今天看到16G的光纤一样被厂商发布出来。以前还有人说16G的光纤可能不会有人用了,可是一样有人在发布这样的东西,在使用。那么,硬件的更新换代对于客户来讲,因为云的架构摆在那边不是一个一两年的工程,所以我们现在有智慧城市,城市云,可能未来就是十年的目标。你想想十年前,2003年我们还没有到4G光纤,那时候在跑2G,现在已经到16G了,对于它来讲,前管的基础硬件变化了以后,它怎么变,所以这是基础硬件的变化问题。这两个范围可能听起来比较大。
对于我们Infortrend这样的存储厂商来讲我们比较关注存储。存储也有两个趋势,第一个就是磁盘介质已经在变化了,我们当下刚好处在SSD和机械磁盘握手交界的一个过程,这个过程我不知道到三年还是五年,总之是处在一个机械盘和固态盘握手交界的过程。机械盘用20年,30年,40年的扇区技术,现在也已经发展,我们接触到新的4TB的盘,已经不是以前的扇区的了。2.5寸盘会不会替代3.5寸盘,当下就可以做一个结论,一定可以替代。因为我们拿到所有的磁盘厂商所提出来的1500转的磁盘,这个月其实就要停产,慢慢的可能明年也都是陆续在供货,明年3月份1.8T就会上线了,配合4K的扇区,它的发展也还要往下走。可是SSD,在企业级存储方面大家提供的SSD很昂贵,昂贵到一颗SSD就可以买一个什么东西。但是,最开始我们看到它的技术是SLC,为了把价格拉低,为了能够替换这些盘,都转换成MLC,eMLC,可能之后还会有一些技术出现。
我们要考虑的就是机械盘和固态盘怎么样共存?未来五年也许我们不会谈这个问题,全都是固态硬盘,也可能在这个争论当中固态硬盘会失去一些东西,这个不好讲,我们当前盘就是机械盘和SSD怎么共存。第三个就是光纤通道,光纤通道10年前是2G,今天已经发展到16倍,市场上最高的时间段是8G的时候,过去的那三年。未来的两到三年,会不会全部换称16G呢?这些都是一个厂商或者是技术流派之间在讨论的事情。对于我们用户来讲,要考量的点是什么?是怎么样让这些技术暂时共存在自己的数据中心里,因为你也没有判断未来谁会赢得这一方市场,或者哪个地方真正统一了这个数据中心,所以要解决的是这个问题。
这里还是分享了16G的光纤,或者是整个光纤市场,光纤的端口在整个数据中心部署的时候。当然,这个数据比较老了一点,大概从08年的第三季度到2011年的第三季度,每一个季度,每一种数据中心在用的连接技术的部署量的统计来自于各个厂商自己所作出的销售表格,数据最终由IDC体规的。最上面就是我们刚刚提到的很多的光纤,MLC的产品,它的整个出货量的值远远高于其他,但是红色增长非常迅猛的就是我们常说的基于IP的产品,还有另外一条,倒数第三条是千兆或者万兆的。蓝色和红色的趋势加在一起,几乎跟FC评分了天下,大概是这样的一个市场的位置。
对于我们Infortrend来讲,我们的产品是全球各处销售的,所以我们也自己统计了一下,这么多存储产品每年卖出去以后,在全球各地哪些客户,或者哪样的结构的产品是客户在使用的,这是从产品的销售端来统计回来我们的销售占比。那么,从产品的接口来看,光纤通道依旧还是占到整个销售产品最大的一个比重,同时也映射到整个市场,其实光纤通道的市场依旧是最大,但是跟IP的产品,或者NAS的产品之间的差距可能会慢慢越来越小,可能会变成评分的角色。
而光纤通道的发展它倒是非常传统的一个技术流派,1988年开始起草FC协议,当前已经准备32G了,当然那个是以后的事情。我看到2013年的时候我们作为第一家发布我们的16G产品的厂商一直到今天有很好的一个历史。那么,这个历史也代表对于客户来讲他的熟悉度,他对光纤通道的信任都是不可以去改变的。
那么,16G的FC和8G的FC有多大的差异,主要就是乘2。我们可以先看下面红色的16G的,16G在流媒体吞吐量很大的应用当中,一个端口可以支持786兆,但是在N2N的数据库应用环境下面,单端口的16G光纤可以支撑56P/表的IOPS。Infortrend讲这么多主要给大家带来Infortrend今年2013年的5月份在市场上作为第一家发布了16G产品的一个厂商,我们的发布不光是说在市面上有一个我们的宣传,或者是市场上的一个动作,我们正式从2013年5月份就接受了客户第一张的16G的订单,今天客户已经慢慢从8G转到16G。所以,你如果依旧是FC的拥有者,可以从8G换到16G,在我们的产品线上可以选择到不同的机架规则的产品部署到你的数据中心,这也是我们在今年发生过的一个G7i的产品,全随机读就是35万次IOPS。
这个系列的产品我们还是把它作为一个基础存储提供给我们云的这种架构的平台的厂商。什么叫基础存储,因为云在很多时候希望后端的存储一个一个是节点,它可以用分布式,可以把每一个节点拉到一起。那么,以前我们可能听到Hadoop或者什么样的架构,我们可以把很多硬盘放到服务器的硬盘,不需要存储,三年前这种观点非常正常。而三年后,我们合作的一些云的合作伙伴都在选用这样的存储,他们觉得如果10个节点跑2G是来自于Hadoop的能力,如果你的厂商只需要四个节点,或者五个节点,成本其实反而会降低。我们这个系列产品还是一个基础的存储,基础存储上面我们也加上一些原有的对于基础存储和入门级存储的一些印象。现在云的应用,一个虚拟化的桌面可以支撑4000或者5000个点的虚拟化的桌面,所支持的IOPS已经达到20万次每秒了,如果你再不提升效能,真的是一个大硬盘了,根本没有什么太大的作用了。所以,我们在这个产品上面更多强调我们的效能、稳定和容量,这个产品的效能上面,最大的体现是VDI、虚拟机、邮件系统、ERP纯粹端到端的用量当中,端到端的IOPS在传统意义上面我们会觉得端到端的IOPS一定请FC处理,IP是不行的,IP不够快,它可能带宽不行,它的LP也不行。可是我们在这个阶段已经完全突破了IP的测试,是我们结合SSD测试的,如果一个机械盘跑200次每秒,需要1700个,可是我们只需要16个SSD就可以把性能上去。而特别是我们的万兆跟光纤相差也差不多10%左右。所以,如果现在我们的客户需要说在整个机房,或者数据中心真的要摒弃FC,或者更多的运用IC技术的是它不用再担心IP技术本身的IOPS的技术不够,其实不必担心。这就是3000系列的LPE(音译)的测试值。
以一个最基础的应用给大家看一下怎么配置这样的一个应用。VDI,虚拟化桌面,这样的架构目前已经非常多的学校、政府在用了,特别是学校,看到很多大学生的、小学的电子教室里已经放VDI虚拟桌面了。我们采用VDI虚拟桌面最大的问题就是每个VDI给你带来50到60个IOPS。我们在配置的时候,一些虚拟化的厂商,比如Vmware提供了很好的解决方案。我们基于ESDS只需要部署几颗SSD,而正常的使用的时候全部都是用机械硬盘,这样的配置可以看一下我们给出来的建议。如果是500个100GB的VDI的应用,我们只需要3颗SSD,29颗2TBNL SAS的硬盘,6U机架的空间。我们往下看,1500个,3500个,SSD的数量也会慢慢的走上去,可是更多依靠还是在机械盘上的存储空间,SSD交给它的就是高IOPS的请求。因为高IOPS的请求对于VDI来讲真的就是在每天早上大家全部都开启VDI之后,启动风暴来临的时候,才会有IOPS的要求。对于客户而言,你可以用8G甚至16G的光纤部署大3500个,但是在1500个VDI之下我们可以提供的还有另外一个方案,就是1G或者万兆的按,这个用户不用考虑FC的交换机,整个部署成本就会被拉低。对于VDI应用来讲,VDI是一个瘦客户机放在你的桌面上,瘦客户机是用千兆线路上去的。如果你给客户配置VDI的后端存储的方案是IP做的,真正可以做到IP端到端的部署方式。
ESDS3000配置的产品我们会体现出灵活度,红色部分就是光纤在占比上还是会大过IP。我们有选择4个8G或者16G的光纤,客户可以在16G和8G之间灵活的转换,假如今天你还是考虑16G可能刚上来,没有什么人在用,那没有问题,你先采用8G的通道来使用,去配置,你跑你的应用。到明年如果16G的确实很稳定,或者整个市场面的反映都很好,你可以很轻松的通过通道接口的更换马上拥有到16G的通道。如果你现在部署是8G的FC,明年想万成万兆的也可以,只需要把通道更换,整个系统不需要做多余的配置。这样的方式对客户来讲就有很多产品组合可以去选择了。
接下来看一下SSD的部分,或者机械硬盘未来的大的趋势。这张数据也是IDC前年给出来了,可能数据也比较老,刚好可以会议一下它在两年前给出来的数据准不准?这是我们的硬盘,就是机械硬盘在各个领域里面的占比,占比最大的对于机械硬盘来讲是企业级的数据存储,2010年整个收获两全球6.1Billion,占到83.9%,然后就是云端的应用,占到8.7%,还有入门级的X86的服务器占到7.3%。到2015年整个盘子可能会增长0.7Billion,机械硬盘的占比会便成78%,而到云端用的这些机械硬盘可能会增长17.4%,而服务器上用机械硬盘的越来越少,少到4.6%。
另外一个在盘这边的对手就是SSD,SSD的发展市场没有像机械盘今天这样这么庞大规模的一个市场,它在2010年只有0.67Billon,所以,存储上面你要考量是怎么样结合SSD和机械硬盘,当下你没有办法做的事情就是把所有数据中心的硬盘全都放在SSD,我想现在还没有这样的事情发生过。一个是成本的考量,一个是产品本身熟悉度的考量。对于SSD和机械盘怎么让它共存呢?SSD有它自己的有点,发热量小,功耗低,超高的I/O的能力,缺点还是有,包括寿命和容量空间,这个容量空间可能比单GB的机械硬盘贵10倍左右,当然从它的性能上来看,一颗可能达到7万8万随即的I/O的能力,还有它的当下的成本。对于客户来讲,或者对于云,应用端也好,你要考虑在当下两种技术交界的时候怎么样把两种技术更好的给和。结合的方式在什么时代都是一样的,更多的发挥这个产品的优点,更多的减少这个产品带来的缺点,你不能全会用,也不能一颗都不用,结合的一些硬盘,结合的点就是存储上面要用SSD做到很好的应用,现在的商品各个友商都把自动分级存储拿出来,让SSD和机械盘不停的做迁移的动作。
SSD结合传统的机械硬盘最真实的一个例子还是回到500个VDI的建设方向来看。如果你用500个100GB的虚拟桌面的环境,IOPS需求30000,另外还有容量的需求,因为它是500个100G的VDI,所以还要同时提供50T的容量空间。假如你直接用传统硬盘来配,我们需要150颗机械硬盘,15000转,那么带来的就是刚刚提到这个需求,30000的IOPS。如果结合自动分级存储,你会发现3颗400级的SSD,加上29颗2TB的NL SAS,58TB的容量空间刚刚好。一个是需要10个3U的柜字,一个2U的柜字基本上2/3全部装满了,从这个VDI的应用也可以映射到我们当下现在其他的一些热点、效应比较瞬间化的一个东西,它不是持续的,比如24小时都是3万次的IOPS能力,它可能只是在一瞬间。其实我们看这样的自动分级会发现,很多的应用都是这样的,都是需要非常需要瞬间支撑的一个I/O的能力。
对于I/O的支撑,我们怎么实现在数据应用的基础模型下面。数据应用的基础模型有三段,第一段是客户端,比如VDI,提出多少个VDI的应用,VDI的客户端,中间会有对应的VDI的服务器,后面有存储设备,或者资源池都可以这样称呼。数据放到存储上面,我们可以看到的是一个数据,对于存储而言,它不知道这个数据的结构是什么?它只知道这里面是一个一个小的数据库,而这些小的数据快最终被放到存储当中去管理。对于我们怎么样管理好这些小的数据块在整个数据生产过程当中发挥到它的作用是我们过去的20年一直在考量的问题。所以,这个也是Infortrend过去20年的一个体现。这个考量点在哪里?存储系统的保障,讲了很多,有很多技术,有很多流派,什么都可以。但是,当下的存储系统你要考量的就是两个点,第一个点就是安全,这个安全也可以等同于稳定。如果它有很高的性能,或者它的稳定度不够高,你怎么样去让它正常的对前端进行使用呢?另外一个,它很稳定,而它效率不高,这也是一个问题。所以,存储的关键点就是存储的安全和存储的效率,因为它要支撑前端的效率,像我们前端的应用更多是支撑后端的存储到底能跑多块。
RAID我们在中国有39项的技术专利,都是保护RAID或者整个存储的安全。那么,对于效率来讲,一个是靠硬件本身的配置,你可以选用更好的处理器,更先进的内存总线技术,或者系统设计上面可以突破一些什么。但是,仅此而已吗在效率方面?其实我们在效率方面更多依赖的是硬盘,在SSD还没有出来的时候我们更多依赖硬盘,而对于硬盘来讲,我们更多的考量点就是一个东西,就是转速,转速和容量一直都是影响它性能的点。但是,如果你想在你的存储上面,或者在整个后端的架构上面让你的机械盘不再作为你的性能的拖后腿的一个部件,那就必须要结合你的SSD。你不会一整柜全是SSD,成本太高,你怎么带一整柜里面部署少量的SSD,结合单机柜的成本,发挥你的特点。
Infortrend在自动分级这样的应用当中更多的强调在SSD怎么样跟不同的机械盘,SSD可能在红色最热点的数据那一端负责数据的进出,或者数据的读写,后端你可以用SaaS,或者7200兆,或者10000都可以随意搭配自己的数据。将不同数据的分级全部容纳在一个统一的数据池,也就是这个数据池里面可能包括4个RAID组,一个来自SSD,一个来自SaaS,一个可能还是分RAID5,RAID6不同的级别。这里面还可以让不同的转在里面工作,工作的目标是给前端的应用服务器映射空间,肯定要对前端的应用服务其做一个映射。重点你画出来的这个新的空间它是跑在什么样的介质上面。以前我们会很清楚的知道,我的这个来自于机械盘,15颗大概这样的一个东西,我现在告诉你的是,这边A、B、C三个虚拟,你不知道哪个是跑在什么上面。这三个不同的是数据全部进入的SSD存在的场景,在数据的热点过去以后,或者根据自动分级算法的标准都可以自己去调试,可以自己去设定,什么时候让这些数据搬移到下面的存储介质上。当然,做任何的过程搬移可能对数据本身的存储性能应该必须大,所以我们在搬移的时候会让客人宣传,或者让用户自己选择搬移的时间。有人存储产品可能喜欢做24小时都在搬移,24小时都要搬移,要提前设计出这个存储百分之多少的性能留给数据搬移使用。Infortrend的想法是客户更清楚自己应用的热点,比如我每周一三五最繁忙,周六日更繁忙,所以我们可能不是周六日搬,是周二搬。
我们作了很多虚拟化的东西,就是在RAID的基础之上做存储池,在存储池里面把每一个小的细化的数据块再打散平分给每一个前端的应用服务器,这个是在RAID上面的一层。我们可以在多个机器之间,假如你有三台这样的存储设备,你可以把这三台所形成的基础分隔开来,可以通过存储池的方式全部拉到一起,然后你的存储池就变成有种不同的介质。所以,你看到的每一个应用它其实就跑在三种介质上面。如果这样做还需要平衡三台之间怎么样动态的负载,这就是硬件的在线扩展。所以,这个技术我们在09年第一代就提出了,当时SSD技术可能并没有那么多,当前很多用户用的都是机械硬盘,今天我们很多客户讨论SSD的时候第一个想到就是这样的架构,我可以在一套机器上面,从上到下部署SSD不同转速的机械盘。但是,如果通过这样横向扩展以后,我其实可以把不同机柜上面的存储设备全部拉到一起,让管理上面更加统一。而最重要的是这样的方式,每一台存储自己的动态平衡是可以实现自己的动态平衡的。
所以,这就是我们的ESVA 的产品,这是第二代,跟第一代的产品一样都是来自于硬件控制器架构下的一个横向扩展虚拟化的方式,这个方式上面,你可以选择的就有光纤,有IP的产品,千兆万兆都可以。在横向扩展的基础之上,你可以通过磁盘的扩展把容量拉伸,也可以通过不同机柜上的所谓的接头的扩展把整个成熟的性能拉伸。ESVA可以控制的硬盘属于可以达到4800颗硬盘,可以将4800颗硬盘都部署在一个大的ESVA系统上,它只会在里面选择可能少量的磁盘的位置来放SSD,机械盘怎么结合SSD,15000的怎么用,7200转又怎么用,这是在大的系统上面才会去考量的点。也正是因为SSD跟机械盘在当下这种交界的过程当中,我们才会更多的想到这样的系统怎么样去使用。
ESVA第二代产品会给我们的客户标配我们的自动分级存储功能,这个功能更多是让客户感觉到你不要想SSD以后到底会部署到什么程度,而是在你现在的环境当中,你现在的方案当中怎么样有机的结合当下并存的两种技术,这是我们的ESVA的产品。对于ESVA做Tiering分级的时候有几个特点,有四级,从0到3四个不同层级的搬移,我可以在机械盘上面做分级,比如机械盘RAID1和RAID5,另外我们可以把这个拆开,你可以设定每一周的每天去做数据的搬移,但是对银行来讲,它说我每个月最后的三到五天不要搬移,我也不要分级,因为我们三到五天全部都是应用,ESVA可以做到这一点。
最后这个优势就是我们的数据定制的搬移化,搬移化和定制,客户可以根据自己的应用的前端的一个繁忙程度或者是什么时候会比较空闲制定一个搬移的时间。所以,这是我们给大家带来的Infortrend的所有的产品线,其实这条产品线可能有些部分也没有提到,但是更多也要结合光纤通道和IP在当下怎么样判断,你不用去判断它后面谁会战胜谁,因为向来我都觉得存储技术而言,很多时候都是事后诸葛亮,很多文章现在写当时什么什么会死掉,可是今天我们看16G一样还在发展,所以你可以选择这种东西。而SSD和机械盘的之争,我觉得很多时候要看到他们谁更有优势,如果单GB的成本来,机械盘的优势最大,如果以单IOPS的能力来讲,肯定是SSD。那么,怎么样结合他们。到存储上面,我们作为存储厂商更多考虑怎么让客户自己选择,谢谢大家!