新平台新突破 9款至强E5服务器横向评测

掐指算来,至强E5-2600平台发布到现在也有半年多的时间了。在段时间里,包括惠普、戴尔这样的国际厂商和联想、浪潮等国内大牌厂商也推出了自己的对应产品。从这些产品的表现来看,新一代的至强E5平台带来了太多的惊喜,包括设计上的巨大革新。从今年4月开始,我们陆续接到了来自各个厂商送测的产品,本次我们的横评一共有9款服务器参与对比。

在进行横向对比之前,我们有必要首先来介绍一下至强E5-2600系列在规格上的特点,看看它相比上一代的至强5600究竟增强了什么。如果你能够很好的理解至强E3的SandyBridge架构,那么你可以将至强E5-2600看作是E3的双路或者威力加强版。我们先来看看下面这个架构图,图中标红的部分代表了E5-2600系列的革新之处。

至强E5-2600处理器架构介绍

至强E5-2600处理器架构介绍

图中为我们传达了4个重要的信息——8核心、第二条QPI通道、DDR3高频内存的支持、PCI-E 3.0互联互通。下面我们就一一来解释这4个要素。

8核心处理器—— 在上一代的至强5600系列(Westmere-EP)处理器中,某些高端的型号采用的是6核心架构,这也是英特尔在双路处理器中提供的顶级核心数量。当然借助于超线程的支持,这个核心数量的数字可以翻一番,但是从物理的角度来说英特尔在E5-2600之前一直是以6核心的产品担当重任。

如今发展到了E5-2600系列,处理器的核心增加到了8个。这个不仅仅是简单的数量提升,要知道在同样适用SandyBridge架构的E3处理器中,核心数量只有4个。更多的物理核心可以提供更好的计算性能,当然对于时下流行的虚拟化来说,多核心的优势更为明显(这也是为什么AMD要推出16个物理核心的Bulldozer)。

第二条QPI通道—— 同样对比上一代的Westmere-EP处理器,英特尔自从在Nehalem-EP中增加了QPI这个概念之后,一直都是提供了单一的通道(可以双向传输)。而这次在E5-2600中,通道的数量增加到了2条,而且带宽也提升到了8GT/s,之前是6.4GT/s。换句话说,同样是基于 SandyBridge架构,双路的产品比单路产品增加了更多的处理器互通功能,这会使得两个或多个处理器之前的协调更为顺畅,言外之意就是性能也会随之提升。

DDR3高频内存的支持—— 从Nehalem-EP开始,英特尔支持三通道的DDR3内存,那时候的频率还是1066MHz。到了Westmere-EP这代,三通道的内存支持没有变,但是频率提升到了1333MHz。如今,至强E5-2600这代产品出现了变化。首先是对于内存频率的支持达到了1600MHz,这还不是最重要的 ——至强E5-2600系列支持4通道内存,最大内存插槽数量也从原来的18条增加到了24条。从数量来说,3*6和4*6的看起来是多了不少,但是能够实现的通道组数量是相同的。当然,在这一代的内存上也有了明显的变化,这一点我们随后会提到。

PCI-E 3.0互联——英特尔在至强E5处理器中增加了对于PCI-E 3.0规范的支持,但是这一代的主板还仅能提供PCI-E 2.0的接口。在可以预见的下一代IvyBridge处理器中,英特尔将全面支持PCI-E 3.0规格。这部分我们在后面会有详细的解释,这里先给大家留下一个印象。

刚刚我们看过了至强E5-2600系列处理器的新改进,这还远远不够。我们需要了解的是E5-2600处理器是如何运行的,具体来说就是如何与其他的设备相沟通。这部分我们来看看下面的一张图。

至强E5-2600处理器是如何运行的

至强E5-2600处理器是如何运行的

首先来解释一个名词——Romley。Romley是本次至强E5处理器的平台名称,是围绕着至强E5处理器而开发的芯片组、主板以及相关技术组成的解决方案平台。因此,这里我们就可以看到这个平台在运行中的一些特性。

基本上处理器部分包括了我们刚刚介绍的内容,我们可以从图示中清楚的看到处理器所提供的40条PCI-E 3.0通道之外,芯片组方面C600系列一共有4个版本,从C602到C608,它们的主要区别在于扩展性能的变化,也就是SATA、SAS等存储接口和 USB等外置接口。但遗憾的是,在SAS应用中提供不了对于6Gbps的支持。

另外我们看到了两个英特尔一直力推的内容,Node Manager节点管理器和Data Center Manager数据中心管理软件。今年开始DELL在自家的服务器软件中使用节点管理器功能,这也是为数不多使用这个功能的厂商。

 

刚刚我们看到的还是以处理器为主,包括如何与外部互通的内容。那么处理器内部是如何通信的呢?这里我们就不得不提及它的核内与核外架构。

至强E5-2600处理器核内与核外架构

至强E5-2600处理器核内与核外架构

这里我们又看到了“圆环套圆环”的设计,也就是从SandyBridge开始的环形总线。与至强E3所提供的类似,这次的环形总线还是分为内外两条,在核心数量上增加到了8个。图中剪刀的部分就是至强E5相比E3来说增加的4个核心。

和E3处理器类似,Ring Bus环形总线更能够较好的展示出Sandy Bridge的真实性能。通过上图大家可以看到,Ring Bus环形总线连接各个CPU核心、LLC缓存(L3缓存)、融合进去的GPU以及System Agent(系统北桥)等部分。

Ring Bus环形总线由四条独立的环组成,分别是数据环Data Ring、请求环Request Ring、响应环Acknowledge Ring和侦听环Snoop Ring。借助于环形总线,CPU与GPU可以共享LLC缓存,将大幅度提升GPU性能。

在这个环形总线上,分布着多个Ring Stop,也就是俗称的“站台”。这个“站台”在每个CPU/LLC 块上具有两个连接点。环形总线的存在,可以大大减少核心访问三级缓存的周期。在以往的产品中,多个核心共享一个三级缓存,需要访问的话必须先经过流水线发送请求,在进行优先级排序之后才能进行。新的环形总线将三级缓存分割成了若干部分,借助于每个站台,核心可以快速的访问LLC。

在至强E5中,还沿用了SandyBridge架构的256位指令集。这部分其实在单路至强E3中就已经谈过,相比原来的128位指令集来说,256位指令集在性能上更为出色。有关这部分的内容我们可以看看E3处理器中是如何介绍的。

256bit指令集,让好事变得更好

256bit指令集,让好事变得更好

Sandy Bridge的AVX将向量化宽度扩展到了256位,原有的16个128位XMM寄存器扩充为256位的YMM寄存  器,可以同时处理8个单精度浮点数和4个双精度浮点数。换句话说,Sandy Bridge的浮点吞吐能力可以达到前代的两倍。不过现在,AVX的256位向量还仅仅能够支持浮点运算。不过AVX的特别之处在于,它可以应用128位的SIMD整数和SIMD浮点路径。

AVX指令集是和Sandy Bridge微架构紧密结合的,因此,微架构的浮点寄存器也要从128位扩展到256位,此外,Load单元也要适应一次载入256位的能力,Sandy Bridge没有直接扩展原有Load单元的位宽,而是通过增加了一个Load单元来达到256bit Load的能力。

在进行新性能扩展的同时,AVX指令集的出现对于原有的X86指令集也进行了优化与重新组合——这主要源于AVX指令集新的操作码编码方式。AVX指令集的编码方式叫做VEX(Vector Extension),其主要用途是缩短指令长度,降低无谓的代码冗余,并且也降低了对解码器的压力,实现的方式也很特别——压缩各式各样的Prefix 前缀,集中到一个比较固定的字段中,从而达到了精简指令集的目的。

 

刚刚我们介绍了许多处理器相关的内容,现在我们将视角转移到芯片组上来,看看SandyBridge的芯片组有哪些变化。这次至强E5-2600搭载的芯片组名称为C600。

C600芯片组的那些事儿

Intel C600芯片组示意图

我们来看看C600芯片组的支持设备图。首先我们发现,它通过PCI-E 2.0与处理器相连,这一点我们在刚才第3页的时候已经提到了。其次就是我们看到了PCI-E 2.0的字样,同样这也是作为PCI-E 3.0的补充而存在的。但究竟你所连接的设备是使用了PCI-E 3.0还是2.0,比如说你连接了一块SAS卡,这个只能依据主板型号的不同而判定了。

除了上面介绍的2内容之外,还有一个内容也是要注意的。在磁盘方面,C600芯片组提供了SATA接口下3Gbps和6Gbps两种磁盘的支持,但是板载的SAS接口却只能支持到最大8个3Gbps接口。如今许多SAS磁盘都是基于6Gbps接口的,也就是说用户需要使用额外的阵列卡才行。

C600芯片组的那些事儿

Intel提供的官方主板设计图

从这个图上我们可以更好的落实刚刚说到的C600芯片组功能。值得一提的是这种双处理器并排的设计,这是Intel所一直强调的,因为这样才能保证在数据中心的环境中,两款处理器收到的散热效果相同。以往的前后设计做不到这一点,因此也被Intel全面的废弃了。

虽然没有提供SAS 6Gbps的支持,但是本次发布的E5-2600系列在磁盘方面也有独到之处。它有一个名为Data Direct I/O的特色技术(以下简称为DDIO),这项技术可以帮助处理器更快速、更智能的选择最短路线来读写数据,从而提升I/O性能。

独特的磁盘控制技术——DDIO
独特的磁盘控制技术——DDIO

通过进出两个方向的对比,我们惊奇的发现如今数据的读写已经不需要像以前那样经过内存才能完成。从LLC可以直接传输到核心中,这样就节省了繁琐的操作步骤,提供了更短的相应时间。之前需要4-5步的操作如今可以简化到3步完成,流水线少了一环,自然也更加快捷。

如今节能是大家都在谈论的话题,而且数据中心应用的能耗是巨大的,因此在这一代的至强E5-2600系列中特别谈到了如何节能的问题。我们先来看看Intel自己有什么兼顾性能和节能的解决办法。

至强E5-2600节能相关的内容

动态调整性能

在E5-2600系列中,英特尔提出了一个观点,就是如何使得兼顾性能的同时保证节能。这里有一个动态开关的概念。我们看到图中的3条线,绿色代表了最佳性能、蓝色代表了均衡性能(提供动态开关),而黄色代表了均衡性能(不提供动态开关)。

在开启了动态开关之后,我们会发现之前处于下风的均衡性能会有一个明显的提升,其吞吐量最终与最佳性能重合了。也就是说动态开关可以保证服务器即便在非最高性能运行的情况下,还可以实现高可用性,这在之前是没有的,也是一个新的突破。

至强E5-2600节能相关的内容

LR内存运行示意图

另外一个是又第三方内存厂商提供的。如今在强调虚拟化的同时,用户也在不断增加内存,这势必对服务器来说也是不小的能耗负担。LR内存的出现就是为了解决这一问题,它本身是低能耗的内存,而且相比传统的R-ECC内存来说我们可以明显的看到它通过一个缓存芯片实现了更快速的数据读写方式,这也是它性能提升的原因所在。

至强E5-2600节能相关的内容

LR内存

提升了性能而又降低了功耗,这似乎是LR内存最大的作用。事实上,LR内存还可以实现非常大的存储容量,在双路平台中它可以实现最大384GB的容量,四路平台中这个数据将翻倍,达到768GB。

如今三星就已经推出了这种规格的内存,但是价位如何还是要等待市场的检验。

下面我们来介绍一下本次横评的9款服务器。在这次横评中,共有惠普服务器2台、戴尔服务器2台、宝德服务器2台、联想服务器1台、浪潮服务器1台、Acer服务器1台。下面我们就来看看它们的具体真容。

全新设计 惠普DL360p Gen8服务器评测

惠普ProLiant DL360p Gen8服务器

定制化的惠普DL388 Gen8双路服务器

惠普ProLiant DL388p Gen8服务器

戴尔PowerEdge R620服务器

戴尔PowerEdge R620服务器

戴尔R720服务器采用全新设计

戴尔PowerEdge R720服务器

IPDC专用服务器 宝德PR2000R

宝德PR2000R服务器

宝德至强E5平台——PR2510V服务器

宝德PR2510V服务器

联想ThinkServer RD630外观介绍

联想ThinkServer RD630服务器

浪潮NF5280M3是至强E5平台的主打产品

浪潮NF5280M3服务器

 宏基AT350-F2是E5平台主打产品

宏基AT350-F2服务器

纵观横评的产品,除了宏碁的服务器之外,其他所有服务器均采用的是机架结构,而且所有测试的9款机型均采用的是双路设计。它们的区别在于设计和应用软件。在新一代的E5平台中,不乏有许多厂商引入了新的设计和软件应用,下面我们将介绍这部分的内容。

Gen8服务器是什么?

惠普最新Gen8服务器全方位解读之命名篇

在以往惠普的X86服务器产品定位中(惠普自己称为工业标准化服务器),惠普服务器各代命名一向是以字母“G”和数字作为区分,比如上一代的G7和之前的G6系列。不过在新品中,这一代产品改为了Gen8。有人说这是出于汉语读音的考虑,从G8到Gen8,的确是给人带来不少的联想。反正名字只不过是个代号,而实实在在的变化才是大家看得见摸得着的。

Gen8服务器有哪些变化?

惠普最新Gen8服务器全方位解读之命名篇

既然是硬件厂商,惠普在Gen8服务器的设计上可谓是不遗余力。最新的改进主要有以下三个方面:集成的周期化管理、智能数据保护和自动能源优化。其中,集成的周期化管理包括了智能配置、主动健康检查和智能更新3个项目,这3者都是用户最先接触到的应用内容,也是得益于惠普iLO4远程管理芯片而实现的。

在智能数据保护中,包括了智能内存、智能硬盘和智能整列卡,这三者看起来更像是依赖于硬件的革新。在设计上,惠普Gen8的硬件也有了很大的变化,这部分内容我们在后续的文章中会介绍。

自动能源优化方面也包括3点,分别是热量发现服务、电力发现服务和位置发现服务。这三点得益于惠普Gen8服务器所提供的3D海洋管理器。这个管理器并不是指的某一个部件,而是遍布于服务器主板及PCI-E插槽中的许多探头。它们可以及时的观测服务器的状态,进而告诉管理员应该采取哪些措施。

把数据更快速地转化为商业:戴尔为流动数据架构扩展到服务器奠定了基础。借助戴尔高速闪存,业内第一个可前端接入访问、可热替换且直接与服务器连接的PCIe固态硬盘,戴尔把Microsoft SQL Server的每秒处理次数较硬盘存储提高了高达10.5倍。Dell CacheCade数据加速器可以把Oracle Database上的查询速度最高提高28倍。

戴尔12GG服务器全线介绍
戴尔12GG服务器全线介绍

简化并自动化基础性系统管理任务:戴尔通过第二代嵌入式服务器管理工具扩展了系统管理功能,可以在服务器生命周期内高效地管理其部署、更新、监控和维护。戴尔新的PowerEdge服务器提供裸机部署和配置,可以最大限度将工程师的工作时间减少85.5%,并且最高可减少86%的手动步骤。此次戴尔系统管理能力是基于其第十一代服务器每年为 Vitacore客户系统管理员节约最多可达43天工作时间的基础上发展而来的。

戴尔12GG服务器全线介绍
戴尔12GG服务器全线介绍

提高能效,为数据中心带来更多新鲜空气:戴尔一直为包含微软必应及其他用户提供全球能效最高的数据中心,通过戴尔第十二代PowerEdge服务器将为所有数据中心带来更多的新鲜空气。如此以来,一个数据中心估计可以在资本支出上节约300万美元。

 

联想ThinkServer服务器解析之特性介绍

在ThinkServer服务器中,提出了“无严苛不Think”、“无创新不Think”和“无易用不Think”的三个口号。所谓严苛就是指的高度可靠性和数据安全,所谓创新就是指悬架技术、智节能和EasyManage等管理软件的部署,所谓易用则包括了免工具、自诊断、灵拓变和易识别等内容。听起来挺玄的哈,下面我们就逐一为大家解释。

无严苛不Think

联想ThinkServer服务器解析之特性介绍

作为ThinkServer家族新品的代表作,ThinkServer RD630秉承Think“高品质”基因, 采用精密的系统设计,并使用高品元器件与材料,通过全球安规认证和军工管理体系认证,成为企业级用户的可靠数据港。ThinkServer RD630通过10多组、160余项最全面的质量标准测试,经过了较业界标准更严酷的测试流程。

无易用不Think

联想ThinkServer服务器解析之特性介绍

ThinkServer 采用整机免工具设计,机箱、硬盘、风扇、电源、内存、扩展卡均采用无螺钉设计,可实现免工具对服务器的拆装,60秒上架,并可帮助IT管理员和服务人员快速修复故障。而ThinkServer家族创新的“灵拓变技术”,令电源、导轨、存储系统、扩展卡、监控模块和管理模块等主要部件可以跨平台使用,大大提高系统的易用性和易服务性。

无创新不Think

联想ThinkServer服务器解析之特性介绍

接下来我们要谈的是悬架系统。ThinkServer家族独有的超缓震技术,有效降低40%因震动引起的系统故障,大幅提升系 统稳定性。采用双体机箱设计,机箱主体为双U型架构,并采用高强度、高刚度材质,强度比 普通机箱提升20%;硬盘仓则采用双层加固设计,强度比普通硬盘仓提升50%。

ThinkServer家族创新的全息缓冲技术,可降低震动30%,该完美结合了在汽车零部件上有广泛应用的锌镁合金的耐冲击性和TPU(热塑性聚氨酯弹性体)的减震性,能够覆盖高中低各个频率段;同时考虑了在水平和垂直方向的减震,有效吸收震动。对于机箱内的主要震动源风扇,ThinkServer采用多重阻尼技术,利用多达60个TPU减震材料填充的防震触点,可降低40%来自风扇的震动。

智节能技术——ThinkServer家族创新的智能能效管理技术,其嵌入的智能算法不但可以实时监控、管理数据中心的机架和服务器组电、热等能耗,帮助IT部门有效优化机房布局,还可以根据企业IT系统能耗的历史数据自动调整企业IT能耗策略;由于采用了承重更佳而厚度仅为普通导轨70%的刀锋超薄导轨。以双路的RD630服务器为例,RD630的机箱比普通机箱宽6mm,实现10%的散热效率提升。

在内部设计方面,RD630采用ThinkServer家族独有的层级散热系统,优先对处理器、内存等发热量高的部件散热,相比传统的四层散热设计可以减少高气流的电阻和对处理器和内存的预热,提升系统的散热效率15%以上;RD630还拥有先进的“星空传感技术”,密布在系统中的50颗传感器准确监控系统的温度、电压等系统状态,为系统的控制和管理提供数据支撑;与ThinkServer家族的其他产品一样,RD630还采用了领先的动态承载电源,使用业界最高标准的白金电源,达到94%的电源转换效率,并可进行动态负载调节,保证电源的转换效率。

智能部署——ThinkServer为用户提供了一系列实用管理工具,可以轻松实现批量部署、管理。全新的服务器导航工具软件Easy Startup帮助IT管理员同时部署大批量服务器,只需点击两次鼠标即轻松可完成业界所有主流操作系统的安装,并可安装过程中配置RAID,无需单独配置RAID,大幅降低服务器部署的人力成本和时间成本。

基于IPMI标准开发的BMC和EasyManage,可通过故障指示灯、邮件、短信的方式对服务器的故障进行报警,帮助IT管理人员远程监控、管理服务器软、硬件,并且支持跨平台使用,彻底解放IT管理人员。联想独创的DIT故障自诊断技术,可对CPU、内存、电源、风扇等主要部件进行精确故障定位,并将系统故障信息直观的显示在前面板上,帮助用户快速定位故障,缩短修复时间。联想特有的固件智能升级系统,帮助IT管理员随时随地升级系统固件,持续优化服务器的运行效率,进一步提高企业运营效率。

其实在刚才的介绍中,我们仅仅是谈到了惠普DL360p Gen8服务器的外观。而对于Gen8系列来说,它所提供的许多内容都是前所未有的,也是非常新鲜的概念。下面我们就拆开服务器的外壳,看看它内部设计的独到之处。

惠普DL360p Gen8服务器特色介绍
惠普DL360p Gen8服务器
惠普DL360p Gen8服务器特色介绍

Gen8内部的散热风扇,一共提供了8个(根据不同机型数量不同)。这些风扇负责了服务器整体的散热,而且智能温控技术,可以根据机箱内部不同部位的温度而进行智能调节,也就是说很可能两个风扇的转速是不一样的。

惠普DL360p Gen8服务器特色介绍
惠普DL360p Gen8服务器特色介绍

所有的散热风扇都可以热插拔,在惠普的Gen8中,使用暗红色标识的则是表现可以热插拔,而是用蓝色表示的说明可以轻松的免工具拆卸。

惠普DL360p Gen8服务器特色介绍
惠普DL360p Gen8服务器特色介绍

这个设计碉堡了。之前的惠普服务器中,还是需要借助工具才能拆卸处理器。而在这代的Gen8服务器中,可以实现了扣具设计。虽然不是惠普首创的,但是这种简单方便的方式直接肯定。

惠普DL360p Gen8服务器特色介绍

PCI-E的插槽设计也有所改变。在之前,几乎所有的服务器PCI-E设备都是需要螺丝固定的,但是这里惠普通过两个手拧的扣具就实现了类似的功能,这或许我们看到的人性化设计最大改变。

惠普DL360p Gen8服务器特色介绍

惠普服务器一直提供的小工具,不过我们觉得对于这一代的Gen8服务器来说它的用武之地几乎没有了。

惠普DL360p Gen8服务器特色介绍
惠普DL360p Gen8服务器特色介绍

DL360p Gen8是一台1U服务器,扩展性能有限。这里惠普提供了转接卡,可以实现PCI-E X16接口设备的支持。

惠普DL360p Gen8服务器主要部件

刚刚我们提到过,这一代Gen8服务器的扣具设计很有特色,而同样让我们惊奇的还有这个CPU的扣具设计。这一代的E5处理器拆卸有点麻烦,需要双面的扣具才可以,而在Gen8服务器中这个问题被化解了。通过一个蓝色的卡扣,用户可以将处理器放在卡扣中,再安装在插座里。非常简单,而且避免了误操作,这里为惠普赞一个。

惠普DL360p Gen8服务器主要部件

送测服务器使用的是至强E5-2650处理器,支持8核心16线程,三级缓存为20MB,TDP功耗为95W。这是中端规格的产品,主频为2GHz。

惠普DL360p Gen8服务器主要部件
惠普DL360p Gen8服务器主要部件

作为Romely平台,可以最大支持到24条内存插槽,这里送测服务器搭配的是4GB DDR3 1600内存,自然是REG-ECC。如今使用4GB的内存有点小了,高达768GB的内存插槽总容量可以支持32GB单条内存,而且从应用来说大家更倾向于选择8GB的产品。

惠普DL360p Gen8服务器主要部件

万转SAS硬盘,容量为300GB

惠普DL360p Gen8服务器主要部件
惠普DL360p Gen8服务器主要部件

惠普Gen8内部整合的阵列卡,支持多种RAID模式。以往,所有服务器的阵列卡都采用的是PCI-E的模式,而在实际应用中,这样的设计会占用额外的PCI-E通道。而新一代的Gen8服务器中采用了FLEX-LOM设计,体积更小更适合1U机型采用。

惠普DL360p Gen8服务器主要部件

Gen8服务器应对了当下虚拟化的需求,机身内部提供了SD卡槽和USB接口,可以方便的链接SD卡或者U盘,实现虚拟化功能(许多虚拟化的平台可以装在SD卡或者U盘中)。

惠普DL360p Gen8服务器主要部件

新一代的Gen8服务器使用了iLO4软件,这被惠普誉为用户第一个接触的软件,提供了远程管理及系统安装、维护等功能,实现了基本的调控。

惠普DL360p Gen8服务器主要部件

来自博通公司的54616芯片,这是一颗千兆网络芯片。其用处就是配合iLO4实现远程管理的功能,而并非是服务器的网络实现。

惠普DL360p Gen8服务器主要部件
惠普DL360p Gen8服务器主要部件

服务器自带的电源,最大功率为460W。这一带的Gen8服务器所有电源模块都是相同的,也就是说可以实现不同机型之间的自由更换。

惠普DL360p Gen8服务器主要部件

出于节省用户采购成本的考虑,Gen8服务器将原本整合的网卡作为可选配置。送测机型提供的是万兆光纤网卡,我们知道这一带的至强平台是支持万兆网卡的,而且这样的设计也免去了再使用千兆网卡的成本。

在我们之前的内容中,已经介绍过了新一代Gen8服务器的全新设计,包括集成的周期化管理、智能数据保护和自动能源优化。

惠普DL388p Gen8服务器设计介绍

惠普DL388p Gen8服务器内部拆解

作为双路机架,惠普DL388p Gen8服务器的内部看起来非常漂亮。标有蓝色的都是免工具的器件,而红色则代表了热插拔。

惠普DL388p Gen8服务器设计介绍
惠普DL388p Gen8服务器设计介绍
惠普DL388p Gen8服务器设计介绍
惠普DL388p Gen8服务器设计介绍

可以热插拔的机箱散热器

这个是Gen8服务器的散热位置,所有双路的服务器都是这样的设计。热插拔的风扇我们之前已经见过,但是这次我们看到的Gen8服务器有了明显的改善,增加了一个整排的模块设计。这个设计之前广泛被DELL采用,现在惠普也加入了队伍。

惠普DL388p Gen8服务器设计介绍

惠普DL388p Gen8服务器作为双路2U服务器,扩展能力更为出色。这里我们看到它提供了多种PCI-E插槽,最大可知道到54个PCI-E 3.0通道。

惠普DL388p Gen8服务器主要部件介绍

服务器使用的至强E5-2665处理器

至强E5-2665是一款定位于双路应用的产品。它的主频达到了2.4GHz,采用了8核心16线程,支持睿频2.0加速技术和8GT/s传输速率,TDP高达115W。

惠普DL388p Gen8服务器主要部件介绍
惠普DL388p Gen8服务器主要部件介绍

单条8GB DDR3 1600内存

惠普DL388p Gen8服务器主要部件介绍
惠普DL388p Gen8服务器主要部件介绍

采用南亚存储颗粒的阵列卡

从Gen8开始,惠普对于传统的阵列卡在外形上有了明显的改进。这里我们看到,它将所有的颗粒都整合在一起,以更小的体积出现。这样的好处除了表示差异化之外,也节省了服务器的内部空间。

对于戴尔服务器来说,强大的设计能力一直是它的优势所在。正如戴尔公司中国区公共事业及大型企业事业部彭宇恒强调的那样——戴尔只做x86服务器,但市场上x86的标准化带来了产品的同质化,对此戴尔的优势如何体现?答案就是差异化的设计工艺,这种设计来源于七千多家客户的反馈。下面,我们就来一起看看戴尔差异化设计的最佳体现。

戴尔PowerEdge R620服务器内部拆解
戴尔PowerEdge R620服务器内部拆解

戴尔PowerEdge R620服务器

戴尔PowerEdge R620服务器内部拆解

处理器及内存部分

按照英特尔对于数据中心的要求,在这一代的至强E5平台中,处理器的分布要平行,这样主要是有利于数据中心的散热考虑。同时,戴尔12G服务器都具备了高温运行的特性,可以在一段时间(比如一个月,视温度而定)内实现高温稳定运行。

戴尔PowerEdge R620服务器内部拆解

服务器外部接口

在外部接口方面,戴尔PowerEdge R620服务器提供了千兆和玩找两项方案,同时还有远程管理模块,配合iDRAC 7功能使用。

在本次送测的服务器中,其搭配了至强E5-2650处理器,及14条DDR3内存。PowerEdge R620提供了四通道的支持,这相比上一代PowerEdge R610所提供的三通道内存来说更多了一些,兼容的内存容量更大。PowerEdge R620最大支持24根DIMM,单条最大容量为32GB,四通道时分为6组,支持最大768GB内存容量。

戴尔PowerEdge R620服务器配件介绍
至强E5-2650处理器
戴尔PowerEdge R720服务器部件介绍

官方参数内容

送测服务器提供的是2颗至强E5-2650处理器,它的主频为2GHz,具备8个物理核心,支持超线程技术,三级缓存为20MB,QPI总线带宽为8GT/s,TDP功耗95W,支持第二代睿频加速技术。

戴尔PowerEdge R620服务器配件介绍
戴尔PowerEdge R720内部设计

刚刚谈到了对于内存的支持,事实上在这一代PowerEdge R620中也加入了对LRDIMM(Load-Reduced DIMM,低负载DIMM)内存的支持。通过将RDIMM内存上的Register芯片改为iMB(isolation Memory Buffer)内存隔离缓冲芯片,LRDIMM内存降低了数据传输总线的负载,让内存系统的整体能耗下降到原来的50%。

戴尔PowerEdge R620服务器配件介绍

PowerEdge R620服务器提供了2个功率为750W的电源,互为冗余。同时我们看到,送测样机配置的是通过80Plus白金认证的产品,说明它的转换效率可以达到92%以上。事实上,从第12代服务器开始,戴尔已经可以提供更高规格80Plus钛金认证的电源,转换效率可以达到96%以上,戴尔也是目前服务器行业中唯一一家提供如此高规格电源的厂商。

看过了戴尔PowerEdge R720服务器的外部结构,作为一款全新设计的服务器来说,搭配E5处理器之后其内部的构造肯定有很大的变化,我们下面一起来看看。

戴尔PowerEdge R720内部设计
戴尔PowerEdge R720内部设计

戴尔PowerEdge R720内部构造,全模块化设计

作为国际化的厂商,戴尔服务器在人性化设计方面一直有着独到的地方。对于服务器来说,如何实现简易拆卸是让许多维护人员头疼的问题。这里我们看到,PowerEdge R720服务器上提供了蓝色和橙色的按钮。其中按钮说明可以用手挤压,而蓝色则说明可以拆卸。这是戴尔的一贯特色,不同的颜色区分可以尽可能减少误操作。

戴尔PowerEdge R720内部设计

需要特别说明的是,PowerEdge R720提供了四通道的支持,这相比上一代PowerEdge R710所提供的三通道内存来说更多了一些,兼容的内存容量更大。PowerEdge R720最大支持24根DIMM,单条最大容量为32GB,四通道时分为6组,支持最大768GB内存容量。

戴尔PowerEdge R720内部设计

PowerEdge R720也加入了对LRDIMM(Load-Reduced DIMM,低负载DIMM)内存的支持。通过将RDIMM内存上的Register芯片改为iMB(isolation Memory Buffer)内存隔离缓冲芯片,LRDIMM内存降低了数据传输总线的负载,让内存系统的整体能耗下降到原来的50%。

戴尔PowerEdge R720内部设计

一排6个散热风扇

从这里我们看到,PowerEdge R720提供了6个机箱风扇进行系统散热。而且这些风扇除了可以单独更换之外,还可以进行整体的更换。这是戴尔早年服务器就具备的设计,更快的拆卸降低了维护时间。

戴尔PowerEdge R720内部设计

冗余电源

PowerEdge R720服务器提供了2个功率为750W的电源,互为冗余。同时我们看到,送测样机配置的是通过80Plus白金认证的产品,说明它的转换效率可以达到92%以上。事实上,从第12代服务器开始,戴尔已经可以提供更高规格80Plus钛金认证的电源,转换效率可以达到96%以上,用户可以自行选购。

戴尔PowerEdge R720内部设计

至强E5平台的最大特点就是加入了DDIO技术。目前服务器应用的I/O数据处理方式,面对成千上万的网络请求以及数据存储队列,缓存较小的CPU通常会将大部分数据储存在内存上,只能优先处理本地缓存上的代码,换句话说CPU需要不断地和内存交换数据,即便目前支持三通道乃至四通道内存,内存的带宽和周期仍然远远低于CPU缓存,这就是性能提升的瓶颈。DDIO的好处就是I/O 数据不必再经过内存,可以直接放到缓存中供CPU读取,这样就降低了I/O-内存以及内存-CPU之间的延迟,处理大规模I/O数据时效果更明显。

戴尔PowerEdge R720内部设计
戴尔PowerEdge R720内部设计

戴尔PowerEdge R720服务器在虚拟化方面也获得了巨大提升。通过至强E5平台, PowerEdge R720能够有效地提升性能,增加整合比率,以及提高虚拟机故障切换、负载平衡和灾难恢复能力等。同时,借助至强E5平台提供的AVX强大指令集功能,功耗也可以很好的控制在企业应用的一定范围内。

戴尔PowerEdge R720内部设计

在新一代的戴尔PowerEdge R720服务器中,至强E5平台提供了PCI-E 3.0的直连功能,而相比上一代的PCI-E 2.0来说,它可以实现带宽数量的双倍提升,从4GT/s提升到8GT/s。更重要的是,这些通道之间可以随意组合,我们看到在PCI-E 3.0提供的40个通道中,每16个通道可以实现2个X8或者4个X4功能,这样对于有效分配带宽非常有帮助,因为并非所有的设备都需要X16通道才能支持。

戴尔PowerEdge R720内部设计

或许在我们的传统印象中,PCI-E设备仅仅限于一些外接的阵列卡等等。如果你要是这么想,只能说明你OUT了,因为一种新的设备正在到来,并且借助PCI-E 3.0的春风很快将成为时尚。

作为戴尔最新采用至强E5-2600系列处理器的平台,我们来看看它的配置究竟如何,这涉及到测试中的具体性能表现。

戴尔PowerEdge R720服务器部件介绍
至强E5-2630处理器
戴尔PowerEdge R720服务器部件介绍

官方参数内容

送测服务器提供的是2颗至强E5-2630处理器,它的主频为2.3GHz,具备6个物理核心,支持超线程技术,三级缓存为15MB,QPI总线带宽为7.2GT/s,TDP功耗95W,支持第二代睿频加速技术。

戴尔PowerEdge R720服务器部件介绍
服务器自带的2.5英寸SAS硬盘
戴尔PowerEdge R720服务器部件介绍
戴尔PowerEdge R720服务器部件介绍

PCI-E扩展卡

戴尔PowerEdge R720服务器部件介绍

服务器提供的万兆网卡

刚刚我们提到,在至强E5系列的平台中,可以提供千兆网卡或者万兆网卡的配置,而这台送测的服务器提供了万兆网卡。对于当今的数据中心应用来说,随着云计算和大数据的发展,对于网络的带宽质量提出了更高的要求,因此万兆网卡必然是未来的趋势。

联想ThinkServer RD630内部架构介绍

联想ThinkServer RD630内部架构介绍

联想ThinkServer RD630服务器

ThinkServer RD630的内部设计非常简洁,提供了许多免工具的设计,这也是联想ThinkServer的新特性。值得一提的是,ThinkServer相比同类的双路2U机架宽了6毫米,联想对此的解释是可以提供更好的散热效果。

联想ThinkServer RD630内部架构介绍

这里我们就要说说联想特色的减震设计,被称为“超缓震悬架技术”。通过磁盘和机身内部的设计,可以有效降低磁盘的震动,延长寿命,同时也可以降低噪音。

联想ThinkServer RD630内部架构介绍

ThinkServer RD630提供了6个散热风扇,实现了5+1的冗余模式,借助于机箱挡板可以实现更好的散热效果。

联想ThinkServer RD630内部架构介绍

可以热插拔的模块化风扇,运维人员可以随时根据故障情况手动更换,拆卸也很方便,这在国产服务器中虽然不是首次应用,但设计却更为精细。

联想ThinkServer RD630内部架构介绍

从配置来说,ThinkServer RD630提供了对于最新至强E5-2600处理器的支持,提供了20条内存插槽,并支持多种磁盘阵列模式。就配置来说,作为联想的主推产品,我们不太理解为什么它不是标配的24条内存,虽然在更高端的产品RD830中可以看到这样的满配,但相比竞争对手的DL380 Gen8或者R720来说,的确是有点差距。

联想ThinkServer RD630主要部件介绍

至强E5-2620处理器

送测的ThinkServer RD630提供了至强E5-2620处理器,主频为2GHz,它有6个物理核心,支持超线程技术,适合进行互联网应用。

联想ThinkServer RD630主要部件介绍
联想ThinkServer RD630主要部件介绍

这是服务器提供的内存,来自现代的4GB DDR3 1600产品。在测试过程中,我们会根据测试项目酌情调整内存的数量,实现性能的最大发挥。

联想ThinkServer RD630主要部件介绍
联想ThinkServer RD630主要部件介绍

ThinkServer RD630提供的是来自希捷的Savvio 10K.5硬盘,这是一款支持6Gbps传输速度的产品。ThinkServer RD630可以提供8个3.5英寸硬盘或者24个2.5英寸硬盘的支持。

联想ThinkServer RD630主要部件介绍

这是来自LSI的阵列卡,型号为9260-8i。也就是说这款阵列卡最大可以支持8个SAS硬盘,当然通过桥接的方式,还可以支持到更多的数量。

联想ThinkServer RD630主要部件介绍

这款芯片很常见,ASPEED这款芯片集成了显示和远程管理功能。下面大家看到的颗粒是内存模块,也是这款芯片所提供的显存。

联想ThinkServer RD630主要部件介绍

这个是服务器提供的千兆网络芯片,也是我们非常熟悉的英特尔82574系列。

下面我们也来看看浪潮NF5280M3服务器的内部是什么样子的。拆下顶盖的方式很简单,只要一个手拧螺丝就可以了。

浪潮NF5280M3服务器内部拆解

浪潮NF5280M3服务器内部拆解

浪潮NF5280M3服务器内部设计

浪潮NF5280M3服务器的内部设计还算不错,使用了模块化的风扇和导风罩。更重要的是,目前除电源之外(电源需要国家强制认证),服务器内包括主板等部件都是浪潮自主设计的,这一点对于国内厂商来说也不太容易做到。

浪潮NF5280M3服务器内部拆解

模块化的风扇设计,可以实现热插拔

需要说明的是,据浪潮官方资料显示,新一代浪潮NF5280M3服务器在噪音控制方面也有着不错的效果,可以有效降低机房污染。

浪潮NF5280M3服务器内部拆解

DEBUG诊断灯

我们在服务器中看到了一个很新奇的物件——DEBUG灯。这个设计在DIY主板中不算什么,但是在服务器主板中还比较少。这个的主要作用是可以快速判断服务器故障,通过指示灯的显示数字或字母就可以知道问题出在哪里,减少维护时间。

浪潮NF5280M3服务器内部拆解
浪潮NF5280M3服务器内部拆解

浪潮与长城合作研发的电源

浪潮NF5280M3服务器提供了2台与长城合作研发的电源,最大功率为700W,符合环保标准。

浪潮NF5280M3服务器主要部件介绍

至强E5-2620处理器

至强E5-2620处理器是至强E5-2600系列中的低端型号产品,主频为2GHz。一般来说,虽然英特尔在推广服务器的时候提供了诸多型号的产品给用户选择,但在实际使用中,受限于经济压力及负载能力,许多厂商还是愿意选择入门级的产品,而E5-2620正是这样一款面向大众用户的型号。

浪潮NF5280M3服务器主要部件介绍
浪潮NF5280M3服务器主要部件介绍

4GB DDR3 1666内存

新一代Romely平台支持24个内存插槽,最大768GB容量的DDR3内存,本次送测的服务器搭配了4GB容量的三星内存,共有96GB。

浪潮NF5280M3服务器主要部件介绍
浪潮NF5280M3服务器主要部件介绍

来自东芝的MBF2300RC硬盘

前几天还看到报道说东芝硬盘在国内服务器市场中销售情况一片大好,果然这次送测的服务器内就采用的是东芝MBF2300RC硬盘。这款硬盘的接口标准为SAS 6Gbps,容量为300GB,转速为10000rpm。

浪潮NF5280M3服务器主要部件介绍

来自ADAPTEC的阵列卡

说到硬盘就不能不提到阵列卡,这是Adaptec 6805阵列卡,能够支持RAID0 、RAID1、RAID5、RAID6和RAID10等多种标准。本次测试我们选择的是RAID10模式,也是一种比较稳妥的存储模式。

浪潮NF5280M3服务器主要部件介绍

浪潮自家的扩展卡

如何能够让一款支持8端口的阵列卡支持全部24块硬盘呢?浪潮这里采用了一个类似扩展卡的设备,这样所有的硬盘都可以直接连到1块阵列卡当中,降低了成本,同时配置阵列也更为方便了。

浪潮NF5280M3服务器主要部件介绍
还是这个远程管理芯片兼显示芯片,我们在国产服务器中多次提到了,这里不解释
浪潮NF5280M3服务器主要部件介绍

英特尔82576千兆网卡

综合看来,送测的浪潮NF5280M3服务器完全符合新一代Romely平台的严苛要求,作为双路产品提供了24个内存插槽,最大支持768GB内存;提供了24个硬盘,这也是我们在继Dell PowerEdge R720xd之外看到的第二款支持24磁盘的服务器,也是目前行业的顶级水平。同时,因为新一代至强E5处理器支持原生PCI-E 3.0接口,浪潮NF5280M3服务器也提供了6个PCI-E插槽。网络方面,标准的千兆网卡是必不可少的,不过数量上这款服务器又原来的板载2个升级到了4个,无疑提供了更广阔的带宽;同时它也实现了对于万兆网络的支持,可以免插槽扩展2个万兆网卡。

宝德至强E5平台——PR2510V服务器

宝德PR2510V服务器内部

宝德PR2510V服务器内部的设计也比较简单,空间比较大,利于散热。下面我们将对其特点一一进行介绍。

宝德PR2510V服务器内部拆解

机箱内的散热风扇

这是机箱内3个风扇,用于系统散热。由于机箱内部比较宽敞,所以3个风扇的设计也完全够用。

宝德PR2510V服务器内部拆解
宝德PR2510V服务器内部拆解

内部的主板和扩展槽

宝德PR2510V服务器内部拆解

至强E5-2680处理器

宝德PR2510V服务器搭配的至强E5-2680处理器,这是一款高端产品,除E5-2690之外的最高型号。我们看到它的主频高达2.7GHz,具备8核心12线程。

宝德PR2510V服务器内部拆解

单条容量为16GB的内存

宝德PR2510V服务器送测时使用的是现代16GB DDR3内存。考虑到测试的需要,我们在一些项目中更换为了更大容量的内存,同时也提供了4通道的支持。

宝德PR2510V服务器内部拆解

来自希捷的ST9300605SS硬盘,接口速率为6Gbps

宝德PR2510V服务器内部拆解

使用了LSI的阵列卡

从配置来看,宝德送测的PR2510V服务器很明显是走的高端路线,不过内存配置略有不妥,我们在测试的时候会进行更换。由于使用了硬件阵列卡,会对磁盘性能提升很大,包括在网络应用中的吞吐量也会随之提升。

下面我们就来看看宝德PR2000R服务器的内部是什么样子的。

看上去很简洁,上面有一面盖,用螺丝刀把螺丝去了就可以了。提供了3个散热风扇,借助于和散热片连线可以实现更好的散热效果。

内部拥有8个内存DIMM槽,最大支持256G 1600MHz/DDR3,提供DDR3高速内存及多线程技术支持,能够帮助企业成长提供强大的扩展空间和性能需求。采用2 颗八核英特尔Xeon E5-2600 系列处理器,可提供强大的计算能力。同时板载了5个PCI-E3.0插糟,其中1个PCI-E 3.0 x16、4个PCI-E 3.0 x8,给用户提供灵活的连接配件。该款机架式服务器采用8个热插拔3.5寸SATA硬盘,同时该机器可转2U机架,智能阵列支持,可显著增强 I/O 性能和可选配的RAID 5 数据保护功能。

被测的宝德PR2000R服务器搭配了4条现代16GB DDR3 ECC Registered 内存,总容量为64GB,64GB内存可满足我们的常规测试。

▲Intel E5-2650

至强E5-2650处理器是至强E5-2600系列中的高端型号产品,它的主频2.0GHz,具备了8核心16线程,工作时功耗为95W。支持英特尔睿频加速技术2.0,可快速将数据从存储设备直接传输至高速缓存。 而主频在CAD/CAE应用中对于性能的影响比线程或者核心数量更大,因此选配高频处理器是必须的。同时,至强E5-2600系列虽然有做服务器的产品(E5-2680),但因为价格较贵,实际使用中用户更倾向于性价比出色的中端处理器。

▲Intel C602芯片组

板载Intel C600系列芯片组,支持8个SAS接口,可做RAID0、1、10。支持多达 8 个 SAS 3 Gb/s 端口、2 个 SATA 6 Gb/s 端口和 4 个 SATA 3 Gb/s 端口、14 个 USB 2.0 端口,8个PCI-E端口。相比英特尔C200和C400系列来说可充分满足高性能计算、电信、门户网站、搜索引擎、Web接入服务器、大型数据中心应用等。

▲WPCM450RA0BX kvm 远程控制器

服务器板载了新唐科技WPCM450RA0BX控制器,Nuvoton是服务器专用远程监控芯片。宝德PR2000R采用智能功耗技术和IKVM,可以通过远程实现服务器开关机、操作系统安装、固定资产管理等功能等,近一步便于运维人员管理,大大降低整体运营成本。

▲WD2003FYYS

这次送测的服务器采用西部数据2003FYYS系列的3.5寸硬盘。这款硬盘的接口类型为SATA,接口速率 3Gbps,容量为2TB,转速为7200rpm,可满足日常的商务处理需求。

PR2000R采用了500W服务器专用电源,其全电压范围自适应服务器,可以实现115V/60Hz 、230V /50Hz自适应,同时支持交流/直流 冗电。

宏基AT350-F2服务器拆下顶盖的方式很简单,只要一个手开下侧面的开关就可以了。

 宏基AT350-F2内部主要配件

AT350 F2提供了3个散热风扇,借助于和散热片连线可以实现更好的散热效果。

 宏基AT350-F2内部主要配件
 宏基AT350-F2内部主要配件

宏基AT350 F2内部24个内存插槽,最大支持到768GB,提供DDR3高速内存及多线程技术支持,能够帮助企业成长提供强大的扩展空间和性能需求。且采用双路E5处理器,其运算能力不容小觑。同时板载了6个PCI-E3.0插糟,其中4个16x通道、1个8x通道和1个4x通道。该款塔式服务器采用8个热插拔,同时该机器可转4U机架,板载集成的8通道SAS/SATA控制器可支持RAID0/110,来为企业数据提供全方位的保护。

 宏基AT350-F2内部主要配件

▲Intel C606芯片

宏基AT350主板板载intel的C606芯片组,支持8个SAS接口,可做RAID0、1、10。支持多达 8 个 SAS 3 Gb/s 端口、2 个 SATA 6 Gb/s 端口和 4 个 SATA 3 Gb/s 端口、14 个 USB 2.0 端口,8个PCI-E端口。相比英特尔C200和C400系列来说可充分满足高性能计算、存储服务器、大型数据中心应用等。

 宏基AT350-F2内部主要配件

▲新唐科技WPCM450RA0BX控制器

服务器板载了新唐科技WPCM450RA0BX控制器,Nuvoton是服务器专用监控芯片,不仅具有KVM视频、远程访问、精准电压、温度侦测等功能。且还可提供完整的硬件监测与管理。在风扇转速的监测与控制方面,根据不同机构设计选择适用的温控方案,使得风扇噪音与散热两者可达到最佳平衡的状态。

 宏基AT350-F2内部主要配件

▲Intel至强E5-2603

送测宏基提供了至强E5-2603处理器,是至强E5-2600系列中的低端型号产品,主频为1.8GHz,四个核心技术、支持4个超线程,工作时功率 80W。主频为2GHz。一般来说,虽然英特尔在推广服务器的时候提供了诸多型号的产品给用户选择,但在实际使用中,受限于经济压力及负载能力,许多厂商还是愿意选择入门级的产品,而E5-2603正是这样一款面向大众用户的型号。

 宏基AT350-F2内部主要配件

▲来自日立硬盘

这次送测的服务器采用日立Ultrastar 15K600系列的3.5寸硬盘。这款硬盘的接口类型为SAS,接口速率 6Gbps,容量为300GB,转速为15000rpm,可满足日常的商务处理需求。

 宏基AT350-F2内部主要配件

▲ 超微PWS-920P-SQ

产自超微的920W 80PLUS 1+1铂金冗余电源,通过80plus的认证,从而体现出它的负载节能,绿色环保,效率高。

对于性能方面的考察,我们主要分为子系统测试和应用性能测试。在子系统测试中我们按处理器、以及磁盘等各个子系统进行了分项测试,当然各子系统的测试成绩也是相辅相成,也需要其它子系统的支持,并非是完全独立的,只是对考察的子系统有所偏重而已。

处理器子系统测试

对服务器处理器子系统的考察,我们主要采用的是业界公认的SPEC 2006测试,该项测试通过对数十个典型应用程序的运行,来测试系统处理器子系统在应用中的整、浮点运算效率。SPEC 2006测试具有很好的开放性,因此在业界为广大用户所接受,可以利用这一公开的测试结果进行系统间运算性能的比较。CPUCPU

此外SiSoftware Sandra也有测试子项可用于处理器运算性能测试,其结果通常以每秒完成的指令数来表现。也可以用作不同处理器间运算效率的比较。

SPEC CPU 2006 v1.1

SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。

SPEC CPU测试中,测试系统的处理器、子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、和图形子系统对于SPEC CPU2006的影响非常的小。操作系统内存

SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

我们在被测服务器中安装了Intel C++ 11.1.034 Compiler、Intel Fortran 11.1.034 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2005 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。

和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64位的Windows Server 2008 R2 下完成,对于每个运算核心,最低配置1.5GB内存。

SiSoftware Sandra v2012

SiSoftware Sandra是一款可运行在32bit和64bit Windows上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的 Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2012对NUMA架构以及最新的Windows 7/Windows Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。

SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

SPEC CPU 2006是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响比较小。

SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

为了运行SPEC CPU 2006测试,我们统一安装了Windows Server 2008 Enterprise x64 Edition SP1操作系统,在主流的x64处理器下,原生64应用要比32位下快。我们还安装了Visual Studio 2005 SP1、Intel C++/Fortran Compiler 10.0.025编译器,对于支持SSE3指令集的处理器,我们使用了QxO编译指令进行了优化。编译时未使用SmartHeap商业优化库。

SPEC测试代表了绝大多CPU密集型的运算,包括编程语言、压缩、人工智能、基因序列搜索、视频压缩及各种力学的计算等,包含了多种科学计算,可以用来衡量系统执行这些任务的快慢。SPEC base测试包括浮点(fp)与整数运算(int)两部分。

整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。

浮点运算包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。

SPEC CPU 2006处理器子系统性能测试

因为在我们的测试中,联想RD630出现了不可预知的问题,导致其在SPEC CPU测试中没有获得成绩,这里我们看到的是另外8款服务器的表现。从这些表现来看,最直接的反映出处理器的主频与测试成绩之间的决定性关系。其中,宝德 PR2510V的出色成绩是因为使用了相对高端的E5-2670处理器,而宏碁服务器则采用的是最低的E5-2603处理器,我们可以看到两者的整数测试性能差距设置接近5倍。相比之下,浮点运算则更考察服务器的整体协调能力,这里我们看到惠普和戴尔表现很出色,领先国产服务器一个量级。

在云计算和虚拟化大行其道的今天,我们也承认像SPEC CPU这样的纯BenchMark软件有着一定的适应性缺陷,但同时我们必须承认的是适当提升主频对于用户的收益更为明显。结合具体的应用,我们在处理器上的投资甚至可能带来更为丰厚的回报。

CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。

CineBench 11.5测试结果

CineBench软件的版本有很多,我们这里选择的是11.5版本,这也是英特尔在发布至强E5处理器时候给出的合格测试版本。在这项测试中,戴尔PowerEdge R620因为兼容问题并没有参与到测试中来,我们这里看到的依然是其他8款服务器的成绩。

和刚才的SPEC一样,这项测试依然被处理器所主导,可以看到无论是单核心还是多核心成绩,处理器的主频依然是非常关键的。这里我们关注的一个亮点是 MP Ratio,也就是图中的绿条,这个是超线程核心性能比,也就是说衡量服务器协同工作的一个指标。因此在这里我们看到,虽然例如惠普DL388p这样的服务器在多核心性能中并不是最高,但此项测试的成绩与高主频的宝德非常相似。

当然这里我们还需要强调的是,这些测试成绩仅就送测机型的配置而言,对于服务器的选购来说配置可以灵活调换,并不代表某款服务器的性能一定是最好,只是给予大家一定的参考。

AIDA64是一款测试软硬件系统信息的工具,它可以详细的显示出PC的每一个方面的信息。AIDA64不仅提供了诸如协助超频,硬件侦错,压力测试和传感器监测等多种功能,而且还可以对处理器,系统内存和磁盘驱动器的性能进行全面评估。

AIDA64内存性能测试

这里我们采用的是AIDA64软件中的内存带宽及读写速度测试。从测试成绩我们可以看到,虽然新一代E5-2600平台支持了最新的4通道技术,但是因为设计及内存相关的问题,从应用来说也会造成性能的差异。这里我们需要提及的是,我们尽可能表现被测服务器的最佳性能,但是因为配置及主板的关系,造成了较大的差异性。

对于服务器厂商来说,英特尔每一次发布主流至强处理器的时候都是一次行业的大事件。按照英特尔的Tick-Tock战略,本次至强E5-2600的发布可谓是行业内两年一次的盛会。在这之前,各个厂商都在筹划自己的新品研发和推广策略,以便在第一时间跟上行业的步伐。

至强SandyBridge-EP平台测试总结

SandyBridge-EP晶圆架构

在本次横评中我们看到了诸多厂商的改进。惠普新一代Gen8服务器和戴尔的12G系列产品都具备着鲜明的改进特色,这些特色体现在设计和应用等多个方面。人性化的操作、远程管理及移动互联网的支持、虚拟化与云计算的应用都是切合时下热点的改进,也是值得提倡的方面。

相对于这样的国际品牌,国内品牌中的联想ThinkServer也是首屈一指,当然这里我们仅就设计来谈。联想ThinkServer的设计理念基于 Think家族的良好口碑和信誉度,在人性化设计和模块化应用方面也有一定的创新,相比于联想之前的万全系列来说可谓是脱胎换骨的设计,如此也代表了国内服务器行业的进一步提升。当然,这些改进相比之下还远远不够,设计的改进只能说明在出货量上有所提升,但软件应用的变化才是对用户更实际的改进。

具体到本次的评测,其实我们也认为单纯的BenchMark已经不能代表服务器的实际水平,只能体现出不同配置下各款服务器的差异性,这其中当然有设计的因素在内,但是在云计算和虚拟化的大潮下,距离用户的应用确实越来越远,这也是我们亟待解决的问题。

本次横评如能对各位读者的选购提供一丝一毫的帮助,我们将诚惶诚恐;在未来的横评中,我们将增加更多类似虚拟化应用等更加贴近主流用户需求的测试内容,做到日益完善,提供更全面的选购指导。

为了这一天,我们一直在努力!