苏州工业园:戴尔EQL、Compellent存储各展所长

在2012戴尔存储论坛的第二天(9月20日),笔者就近参加了对苏州工业园的采访。接待我们的是苏州工业园区计算机信息中心主任袁飚和首席系统架构师杨迪,还有戴尔公司的随行人员。

苏州工业园:戴尔EQL、Compellent存储各展所长

苏州工业园区计算机信息中心生产机房

今年5月,我们曾经发布过《苏州工业园采用戴尔EqualLogic云存储》案例一篇,而在本文中讨论的内容就是与这些设备紧密相关的。

苏州工业园:戴尔EQL、Compellent存储各展所长

苏州工业园区计算机信息中心生产系统、容灾系统的快速建设(实现VMware虚拟层与IP SAN存储层的双层容灾体系,点击放大)

如上图,根据戴尔提供的资料:“苏州工业园区计算机信息中心将2011年初购买的2套EqualLogic PS6000XV IP SAN存储节点(B1、B2),和原有的2套EqualLogic PS6000XV(C1、C2,2010年购买)迁移到另外一个机房,作为云平台的容灾存储;与此同时,在生产机房保留新购买的1套EqualLogic PS6100XS存储节点(A1)、2套EqualLogic PS6100XV IP SAN云存储节点(A2 、A3),既A1、A2、A3云平台的生产存储组。

在容灾方面,首先实现VMware虚拟层快照方式容灾,具体以生产机房虚拟机V1为例,虚拟机V1连接到A1、A2、A3,存储组内的LUN1,其WMDK文件存储在LUN1内,利用戴尔自动快照管理器,既ASM/VE(Automatic Snapshot manager/VMware Edition),可在VMware环境中快速完成快照制作,最终实现虚拟机备份与恢复的全面自动化;其次实现IP SAN存储层异地容灾,以上述虚拟机V1为例,虚拟机文件VMDK与其快照VMDK Snapshot文件所寄宿的LUN1,可以通过IP SAN自带的LUN快照功能,在IP SAN层面制作LUN1的快照(LUN1 Snapshot),在虚拟机出现故障需要恢复的时候, 备份机可以快速挂载LUN1 Snapshot,进而实现IP SAN存储层的容灾与恢复。

在软件方面,戴尔为苏州工业园区计算机信息中心免费提供了全套的存储管理软件(这也是EqualLogic软件授权的特点,笔者注),园区计算机信息中心的IT管理人员可对IP SAN存储节点进行综合管理,并可以方便地实现存储监控、远程CDP、本地CDP、VMware单虚拟机单文件&多虚拟机多文件瞬间恢复等功能。尤其值得一提的是,戴尔将EqualLogic存储节点内的系统软件,升级为统一的最新版本,自此C1、C2、B1、B2节点,也拥有了与A1、A2、A3完全一致的存储优势,例如可以实现自动化的分层存储等功能。”

补充:上面拓扑图的最左边,我们还看到在生产机房还使用了光纤通道主机连接的戴尔Compellent存储设备,下文中会有进一步说明。

苏州工业园:戴尔EQL、Compellent存储各展所长

如上图,在相隔10公里的生产机房(DC1)和容灾机房(DC2)之间,通过核心交换机的万兆以太网(10GbE)裸光纤连接。不过苏州工业园目前使用的EqualLogic PS6000和PS6100系列还都是千兆iSCSI主机接口(如下图),未来按计划可能采购PS6110或者其它戴尔10Gb iSCSI阵列。

虚拟化提高资源利用率:存储达到85%

苏州工业园区计算机信息中心首席系统架构师杨迪介绍说:“在这个架构当中,可以看到我们的资源中心,其实是一个循序渐进的过程。当初我们是一个单中心,从05年开始在循序渐进的做虚拟化的整合,我们差不多最多的时候有100台左右的服务器。慢慢的减少和虚拟化,不断的整合和改进,到现在承载百分之九十九业务的系统,几乎全部是在我们的十台戴尔的PowerEdge R900和R910服务器上。”

注:在云平台前端主机方面,苏州工业园区计算机信息中心全面采用了戴尔PowerEdge系列4路服务器,这些服务器有些配置了四颗英特尔至强7440处理器,有些配置了四颗英特尔至强7550处理器。

苏州工业园:戴尔EQL、Compellent存储各展所长

实施虚拟化最大的好处就是提高资源的利用率。在苏州工业园区电子政务私有云平台建设的过程中,我们看到从2008年~2012年,CPU平均利用率从10%提高到25%,内存平均利用率从40%提升到75%,而存储平均利用率则从40%增加到85%之高。这应该可以表明,戴尔EqualLogic和Compellent中端存储在内部空间资源虚拟化方面的效果(主要是容量节省),与以自动精简配置(Thin Provisioning)而著称的惠普3PAR基本达到了同一水平。

苏州工业园区计算机信息中心主任袁飚表示:“尝试了虚拟化以后,得到的一个好处就是节能,绿色环保的概念更好。我们现在的负载应该能达到大概六成左右,这个(与虚拟化之前)差别很大。现在我们整个一号资源中心有300多个虚拟机,跑了几百个系统,但是真正的实体机也就是十台左右。”

存储方面,我们也是从一开始就跟戴尔合作。那个时候还是OEM EMC的机型。从开始也是FC存储,到现在还是逐步要统一到IP(iSCSI)的存储,包括存储虚拟化。备份方面,早先我们用了一个飞康的CDP,到目前基本上在逐步转到戴尔阵列提供的数据保护功能。”

ChinaByte比特网:关于iSCSI,笔者在《2012戴尔存储论坛:彰显软件核心战略?》一文中曾经写道,“EQL将继续挖掘Scale-out iSCSI产品的潜力,而CML家族保持以光纤通道为主的传统双控制器设计,FCoE可能是Compellent未来的发展方向。”当然Compellent基于服务器硬件的控制器设计也很容易支持万兆iSCSI。以太网存储除了能够简化、统一数据中心网络结构之外,IP SAN相对于FC和FCoE的一个优势就是能够通过广域网的路由功能,跨越数据中心长距离传输/复制(通常是异步)。

Compellent细粒度CDP,EqualLogic“纯2+2”高可用

苏州工业园:戴尔EQL、Compellent存储各展所长

苏州工业园区计算机信息中心生产机房中的部分戴尔EqualLogic阵列

在谈到为什么最终选择了戴尔EqualLogic这种架构时,杨迪表示:“我们觉得EqualLogic能够提供一个很好的扩展的能力和丰富的功能。我主要想讲的就是非断代式升级的一个策略,我们每一次在扩展这个存储层的时候。虽然说它的型号可能会有变化,从这一代到明年就可能会升级到另外一代,但是整体的架构里边软件是统一的。它的功能是统一的,操作方式也是统一的。我们不需要有很多的知识更新,这就对于我们的维护,对于我们的技术团队来讲,是基于一个非常好的实践经验。

第二个我想说的是,EqualLogic提供了一些功能以及贴近虚拟化软件的一种整合,这个我在其他的一些存储解决方案里面就是很少看到的。一个是CDP(持续数据保护),因为在整个云的,在我们大规模的虚拟机和系统的承载上,如果想要去做一个快速的数据保护和恢复,用传统的备份的方式是难以实现的,我们的RTO根本就不允许。那么就是说,通过CDP这种快照的方式可以很好的去解决这种问题。我们做CDP的时候,可以是针对一个系统的一部分数据去做 ,也可以整体的去从整个虚拟机的角度去做。那么这几种保护方式都可以实现我们既定的这么一个目标。

其次一点,EqualLogic还提供了一个非常好的市场化的东西,就是对整个存储使用情况的分析工具。一个叫做SAN Headquarter的软件,这个软件可以帮助我们清晰的透视到整个存储层的内部,看到这个存储的性能和当前使用的一个状况。可以快速的去做出一些决策,如果有问题的时候到底问题出在什么地方,如何快速的去定位,然后如何去改进?”

苏州工业园:戴尔EQL、Compellent存储各展所长?

位于机架上的EqualLogic PS6100(XV)和PS6100XS(上面的那台)。后者是2U 24个2.5英寸驱动器的配置,包含了自动分层存储的7个400GB SSD和17个600GB 10K机械硬盘。

当笔者进一步问及容灾方面的细节时,杨迪说:“现在升级到(EqualLogic固件)6.0之前,我们用的是一个异步复制的功能,在6.0以后慢慢的就会把同步的功能应用进去。

对于其它的一些解决方案来讲,这个功能的成本会是比较高的。但是现在EqualLogic是免费提供的。在这一点上,我想这个东西其实也属于一种服务的范畴,让我觉得有免费的功能提升。”

补充:上文中提到过某厂商的CDP软件,苏州工业园以前用过这种带外的数据保护方案,它没有双节点HA的功能,而且在每台服务器主机上安装的代理都要收费。相比之下,EqualLogic的同步复制等软件功能都是免费提供,而且能够实现“纯2+2”(2台双控机箱)高可用,透明切换。也就是说使用万兆EqualLogic的型号,建立在10公里之间裸光纤的DCB(数据中心桥接)无损以太网基础上,一台存储故障时另外一台能够接管数据访问。

苏州工业园:戴尔EQL、Compellent存储各展所长?

苏州工业园区计算机信息中心生产机房中的Compellent阵列(局部)。完整的系统还包括SC30双控制器中的另外一台服务器节点,以及更多的驱动器扩展柜(共3个)。尽管这套存储是FC主机接口,但他们未来的规划基本上都是以太网(iSCSI)。

杨迪还说:“很多人会问我,你有了EqualLogic,为什么又要有Compellent?其实这个就是面对一个不同的CDP要求。我们有一些业务系统,比如说这个房地产交易中心的业务系统,它每天都在交易房产信息,对数据的保存和恢复粒度要求的RPO非常短。

拿政府应用来讲,可能我4个小时到6个小时做一个快照就可以了,因为一个上午它不会有太多的交易。像卖房子那东西不一样,有点类似银行分分秒秒都在做这个,那我就需要高频率的CDP,在这种情况下我们就会把它的那个存储挂到Compellent上面去。是出于这样的一个考虑。但是从使用数量来讲,我们的EqualLogic可能是在存储里面占到了70%,Compellent可能是30%的情况。”