如何采购多主板式x86服务器

藉由实机介绍,分析多模块机架式服务器的各项优缺点,协助你判断是否适合购置此类机种

企业内IT系统日益发展,所需要的服务器数量也会越来越多,不过有些企业的机房空间有限,机柜容积不足,并无法随心所欲增加主机数。为了要在有限的机柜空间内,增加物理服务器的数量,藉此提供密度更高的运算。因此许多厂商开始设法于相同的机柜高度内,增加更多的实体主机,如刀片服务器 (Blade Server)、多主板服务器(Multi-Motherboard Server)。

将服务器压缩,藉此在相同机柜空间上,提供更多台服务器的运算效能,常见的用途,就是高效能运算(High-Performance Computing,HPC),将数量众多的服务器与处理器,搭配平衡负载设备等装置,将这些提供运算服务的计算机,集结而成一台超大型运算设备,以处理超大量数据计算。也因为需要许多处理器来计算超巨量数据,在预算许可的情况下,HPC需在有限的机房空间内建置数量最多的物理服务器与核心数,而刀片服务器与多主板服务器的高密度特点,正好符合高运算机房的需求。

刀片服务器的设计,是将各个计算机组件模块化,以特殊规格开发出体积更小的服务器模块,因此相对于同机柜高度的服务器,这类大多能容纳更多的运算模组(主板、处理器、内存),如Dell M1000e刀片服务器,最多可在10U空间内提供16个服务器,藉此增加机柜利用率。

相对于刀片服务器,多主板式的服务器构造很简单,而且售价大多也便宜许多。事实上,这类俗称「双胞胎」的服务器(Twin Server),其实就是将两片或更多片主板,置入同一个机箱内,以便一次拥有多个运算模块,例如在1U空间内,配置了两个主板,等于半U就能有1台服务器,实体主机数量整整多了1倍,因此也有人称为半U服务器。事实上,不只是1U高度的服务器,也有厂商推出2U机箱内设置4个主板的机型。以厂牌而言,目前台湾销售此类服务器的,多以本土厂商为主,包含凯稳、微星,泰安,以及Supermicro等国内外厂商;对多数主流外商而言,如IBM、 HP、Dell等厂商,在台湾市场,大多以刀片服务器为主力产品之故,因此很少厂商推出这类主机。

除了用作高密度运算外,我们也可以选购多主板服务器,建置高可用性丛集架构(High-Availability Cluster)。而主要是由于这种服务器购买时,需要同时购买两个运算模块,等于同时购买两台实体计算机;若将这两台主机配置相同的处理器与内存,就能 让这些主机成为彼此的后备计算机,如数据库服务器、AD服务器等系统。若是企业内需购买多台服务器来建立高可靠架构,也能考虑这类服务器。

与一般机架式主机相较,多主板式服务器运算密度较高,但精简后,相对也必须注意有些不便之处,并搭配其他解决方案,如这类服务器的磁盘连接数量较少,可连接外部储存装置来解决此类问题。

由于1台多主板服务器本身就有两个实体主机,实测时我们也曾使用此类服务器作为测试平台,当时是将Supermicro SuperServer 6015T-INFB用做虚拟化平台的实测,并安装各种虚拟化系统,而6015T-INFB上的两个模块使用相同的处理器与内存,如此一来,我们在1U 的机架空间上,就有两台硬件架构完全相符的物理服务器,恰好可以作为我们实测虚拟平台,让我们对照、测试不同虚拟平台在相同硬件环境上,内存数量等系统资源的使用情况,并藉此测试在线移转(Live Migration)、动态资源调整(RDS)等进阶管理功能。

优点:运算密度高,性价比良好

目前市售的多主板服务器,大多都是设计于机架式主机上,主要的诉求如同前面提到的,要在有限的机架空间内提供更多台实体主机,以 Supermicro另一台SuperServer 1025TC-10G而言,它有两个支持Intel Xeon 5400双处理器平台的主板,分别位于服务器两侧,而每侧运算模块都有各自的磁盘驱动器与网络等I/O装置,电源供应器则是两个模块共享的,这和我们先前接触过的多主板服务器类似。

1025TC-10G在1U的机箱空间内,处理器插槽总数是4个,若都搭配4核心处理器,运算核心总共可高达16个。对于需要在有限空间,达到大量运算效能的情况,这类主机的高密度设计可满足此种情况,而且费用相较于刀片服务器也便宜许多。以我们本次借测的1025TC-10G来说,空机售价仅 65,000元,与一般刀片服务器含机箱动辄超过10万元相比,多主板服务器的价格较低;而配备完整的多主板服务器售价,大约在120,000至 200,000元之间,其差别依照规格配备的各自考虑而有不同,但相对于购买两台规格相同的1U服务器,仍便宜一些。

多主板式服务器的机架高度,大多设计为1U或2U,而且不论哪一种高度,内部服务器的密度均相同,平均每1U就有2台服务器。和一般服务器选购 相同,购买这种双胞胎服务器,处理器规格与内存扩充量等规格选择,与一般服务器并无太多差异,扩充量原则上都是越多越好。如果是要建立HPC,选购时可 以针对预算、处理器总数或是物理服务器总数、机柜可容纳空间等依据,选择所需要的服务器。

此外,这类服务器销售时,等于同时出售两台实体主机,若是企业内刚好有需要2台或偶数量的服务器,并且皆置于相同机房内,在规划许可的情况下,也可藉此降低设备购买成本。

先天限制:扩充性、端口数量较少,但都有方法可以提升

主板设置密度高的最直接缺点,就是影响服务器的I/O扩充性。受限于体积,这类服务器适配卡、磁盘等组件的扩充性都不佳,像1025TC- 10G,仅能再加1张适配卡,如果需要同时安装2张适配卡,如同时加装磁盘阵列卡与光纤信道适配卡,这样的扩充性就无法满足需求了,建议选择一般的通用机架式服务器较适合。

磁盘扩充性较差,可连接外部储存装置补强

这类服务器的磁盘安装数也不多,有些机种单一模块仅能安装2台3.5?磁盘,如我们先前实测的泰安GT24,因此能选择的磁盘阵列模式屈指可数,使数据保护的弹性大打折扣。

而 1024TC-10G相较之下,每个模块足以搭配4台2.5?硬盘,虽然可配置基本的磁盘阵列模式,多于只能容纳2个3.5寸的同类机种,但对安装数量超过6个的一般1U主机而言,数量依然仅能提供基本运作,若是需要较大量的储存空间,就得选择其他服务器,或连接NAS等外部储存设备。

为了加强外部储存装置连接的能力,有些多主板式服务器会内建InfiniBand传输通道,加速服务器对外部磁盘的I/O效率。 InfiniBand是一种光纤传输端口,以该接口透过专属的InfiniBand交换器,去连接服务器与外部储存装置,目前其传输速率介于 2Gbit/s至24Gbit/s。相较于其他使用一般网络接口储存装置,网络传输多为GbE或10GbE,并且还需负责传递其他网络资料,InfiniBand的I/O传输速度快上许多。
USB等端口数量略嫌不足,可搭配USB集线器改善

在高密度诉求下,除了扩充性会受到影响外,另一个就是端口的数量容易不足,特别是USB端口。以1024TC-10G为例,每侧运算模块仅有2个 USB端口。事实上,在大部分服务器运作模式下,几乎不会用到USB装置,因此这样的配置其实绰绰有余,即使是初始化系统建置或后续维护,少量USB端口依然绰绰有余,但由于双胞胎服务器上往往精简光驱或磁盘驱动器等I/O组件,有些机种甚至没有连接键盘与鼠标的PS/2。面对这种情况,我们可以多准备一组 USB集线器,供多个USB装置连接,藉此解决端口不足的问题。

除了USB端口数量不足外,这类服务器前方面板,大多也没有配置USB端口,这对主机上架后的维护有些不便,作业时都需要绕至机柜后方才能操作,而这也是这类服务器的不便之一。
市售机种并无内建光驱或磁盘驱动器,使用时需自行外接

多主板服务器省略的装置,还包含磁盘驱动器与光驱,以我们整理的规格表中,所有的主机都没有包含DVD光驱,亦没有内建软盘驱动器,这和一般服务器大多内建 DVD光驱有些不同,若是要用光驱或软盘驱动器安装操作系统或应用程序时,需要自行外接光驱或软盘驱动器,以我们实测的经验,是采用USB转 IDE/SATA的转接器,再连接光驱来克服上述问题。

虽然这种服务器没有内建光驱,且USB端口的数量也略嫌不足,在设定操作上造成些许不便,不过绝大多数的服务器,都只在刚建置时,才需要使用这些装置与端口,等操作系统与相关程序安装完毕、设定参数调整好,让系统顺利上线运作之后,除非硬件需要更新或维护,否则在一般情况下,并不需要频繁接触电脑实机,所以这项影响操作管理的不便因素,往往也只在初始建置时,只要前期多费心布建系统,后续这些管理上的问题并不会造成太多影响。

注意模块共享产生的风险

为了充分利用每一寸空间,这类服务器大多会共享许多模块,如电源供应器。当这些模块故障时,会影响所有使用此组件的模块,严重时甚至会影响所有模块运作,因此选购时,要留意可能产生的风险,并针对这类问题去规划妥善的应变之道。
共享电源供应器损毁,将影响所有模块,需考虑备援

这类服务器中,有些机种内的模块是共享电源供应器的,1024TC-10G就是如此,若是该供应器故障,就会同时影响这些模块运作,也代表将会有2台主机 同时停止运转,会增加许多系统服务中断的风险,换句话说,若要选择这类服务器,在风险管理与备援机制上就要多花点功夫,如多建置1组后备系统。

事实上,基于上述问题,近来亦有厂商推出各模块使用独立电源供应器的机种,如泰安的YR188,每张主板上皆连至独立电源,就不会发生两台服务器同时中断的问题。此外,有些共享电源供应器的机种,则是设计为1+1备援式,如凯稳ESR0013,藉此方式提高电源可靠度;有些服务器的单一模块,甚至有专属的1+1备援式电力,如泰安YR290,是此类设备中,电源可靠度最高的机种之一。

除了电源供应器之外,有些机种的系统风扇是共享的,如凯稳的ESR0013。若风扇模块中有任何一个故障时,会影响每个模块的散热。事实上,当散 热模块中有一个风扇故障时,其他正常的风扇会加速,以维持足够的散热气流,避免服务器过热当机。面对这个问题,我们可定期监控,或搭配其他管理工具发布故 障通报,在第一时间更换料件,让服务器恢复正常运作。
机房散热效率更重要

这类服务器空间狭小,气体流动范围因此受限,这对于散热是一大考验。虽然在我们实测过程中,并没有这类服务器因过热而当机的记录,但在我们的测试 环境内,观测到的温度亦较一般1U主机高了1、2度。若是机柜内有该类主机大量堆栈,机房内的散热规画就需要更多留意,这点可以参考刀锋服务器的冷却管理方式。

由于服务器密度很高,因此整台设备背后连接的线路也可能非常多,如果没有整理妥善,会阻碍主机后方的散热气流排出,影响服务器散热质量。当服务器建置完成后,最好花些时间整线,让主机后方能将热气顺利排出。

相同机柜高度的配置电力较高

由于多主板服务器在相同机柜高度下的核心数、主机数量较多,因此用电量会比一般机架式服务器高些,以我们规格表内整理的1U主机为例,它们的电 源供应器若以共享方式来看,少则780瓦,有些机种甚至高达1000瓦,跟一般600瓦左右的1U主机相比,用电量增加许多,若是要安装于IDC机房内, 就需要留意代管业者提供的电力插座能否因应;如果是建置在企业本身的机房中,UPS负载与整体用电规划也是要注意的。

综观上述各种优缺点,以及建置时可能会遭遇的状况,这种高密度服务器的设计,仍能够解决许多机房内空间不足的问题,至于磁盘空间不足,或操作管理不便等,可以设法搭配其他解决方案,如此一来依然有采购的价值。

备注:刀锋伺服器指刀片服务器