刀片服务器扩展能力历来遭人诟病,率先发难的是虚拟化。由于通过虚拟化的整合,更多的应用被集中到少数的物理服务器,如此,I/O瓶颈的问题将更加突出。在机架式服务器的解决方案中,可以通过增加网卡,通过链路汇聚来缓解问题。但是对于刀片而言,由于其高集成度的特点,其内存容量、扩展能力都受到一定的限制,因此成为了诟病的对象。此外,也是受制于扩展能力,用户所使用的一些特殊扩展卡,如加密卡等,无法在刀片服务器上使用,因此也影响了刀片服务器的推广。
八仙过海
为了解决刀片服务器推广中的难题。刀片服务器厂商也使出了浑身解数。以HP为例,针对虚拟化推出了业界首款虚拟化刀片HP BL495c G5,一是增加了内存DIMM插槽的数量,另外采用了Virtual Connect Flex-10技术,可以将一个万兆网络接口划分为4个Flex网卡(FlexNIC)使用,每个Flex网卡可在 100Mb~10Gb 范围内灵活调节,其增量为 100Mb。但是对于更多的型号而言,HP希望通过刀片网卡所支持的网口数量来解决问题,可以说,这些措施在一定程度上,缓解了I/O的压力。但是针对特殊扩展卡的应用需求,现有的产品往往无能为力,或者需要花费相当的代价,例如IBM、HP都推出了相应的扩展方案。但是这些方案都需要占用机箱的插槽位置,使得集成度有所削弱。
从目前的流行趋势看,刀片服务器以HP的10U16刀片,IBM的7U14片为代表,基本分为10U和7U两大阵营。因此,当曙光推出10U10片的TC3600刀片服务器的时候,并没有引起我更多的注意。但是经过认真的学习研究发现,曙光TC3600在设计上的确有独到之处。
独创I/O刀片
TC3600的独特之处,一方面表现在存储模块上,其机箱配备了10个2.5英寸的磁盘,它们可以可任意划分给10个计算刀片,基于计算刀片本地控制实现RAID。通过存储模块的扩展,提高了计算刀片对于本地存储的需求。目前,IBM只有在针对中小企业应用的BladeCenter S中提供了类似的功能,但在企业级应用的BladeCenter H中没有提供类似的扩展。HP方面,主要是通过占用机箱的插槽来提供扩展,没有提供基于中板共享的本地存储扩展。
I/O刀片是TC3600更为独特的设计。在机箱的背部,TC3600提供了10个I/O刀片或者称为I/O扩展模块。这种I/O刀片分为IOB- G、IOB-T和IOB-G2等三个类型,其中,IOB-G I/O刀片提供了一个标准的PCI-E Gen2 8x插槽,并提供了两个2.5英寸磁盘的位置;IOB-T则是提供了一个标准GPU计算模块;而IOB-G2则是提供了两个PCI-E的插槽,据了解,目前IOB-G2还在设计阶段,并没有正式对外发布。据曙光刀片服务器产品经理汪平介绍,通过I/O刀片的支持,将可以极大缓解刀片服务器I/O的瓶颈问题。目前,只有曙光TC3600采用了这样的设计。
汪平表示,TC3600的设计符合HPCSC与SSI标准规范,该产品设计也得到了来自Intel的大力支持,其计算刀片可以与符合SSI规范的刀片服务器混插使用。目前,Intel提供基于SSI规范的白牌刀片服务器。国内服务器厂商方面,浪潮、宝德、联志都推出了相应的产品。
10U的奥秘
表面看来,曙光TC3600既不同于HP的10U16片,也不同于IBM的7U14片,其中的奥秘就在于I/O刀片。在10U高的空间内,曙光本可以集成更多的计算刀片,但是I/O刀片和存储扩展模块占用了一部分空间,所以TC3600采用10U10片的设计。与此同时,曙光还发布了 SysCache I/O加速卡,它采用内存技术,配合软件对视频数据等高IOPS需求应用提供加速。该加速卡,可以利用I/O刀片对刀片服务器进行加速。因此,SysCache就是一种特殊应用的扩展卡。
由于I/O刀片占据了刀片机箱背板的部分空间,对于I/O扩展提供了方案选择。但是与此同时,会不会影响网络模块呢?在曙光TC3600的设计中,提供了两个高速交换模块和两个低速交换模块,其中,高速模块可以支持2个20G DDR InfiniBand交换(机)模块或者1个40G QDR InfiniBand交换模块或者2个万兆以太网交换模块;低速模块方面,可以2个千兆以太网交换模块或者2个FC交换模块(未发布)。从数量来看,较之 HP刀片偏少,有兴趣的用户可以自己对比一下。
可以说,曙光TC3600在设计上有自己的独到之处。曙光以高性能计算见长,在网络连接下具有自己的独到之处。据了解,曙光TC3600并不仅针对高性能计算,同样适用于企业级计算。总之,衡量一个刀片服务器设计,除了功能之外,性能、质量也是非常重要的指标。刀片服务器在节能设计、散热制冷等环节都具有很高的要求,业内将刀片服务器视为一个小型的数据中心,从制冷、配电到冗余设计一应俱全,因此期待曙光TC3600具有更加杰出的表现,用户也应该用更加全面的评价,理性对待各种刀片服务器的设计。