高密度应用 惠普DL388p Gen8服务器首测

今年3月,惠普在北京正式发布了新一代的Gen8工业标准架构服务器。新一代的Gen8服务器凝聚了惠普大量的技术投入,也赢得了行业内的一片赞叹。之前,我们曾经为大家介绍过惠普DL360p Gen8服务器的测试——全新设计 惠普DL360p Gen8服务器评测。今天要带来的是另外一款惠普主打机型——DL388p Gen8。

定制化的惠普DL388 Gen8双路服务器

我们看到的这台服务器是惠普最新的DL388p Gen8服务器。熟悉惠普的朋友都知道,惠普在双路系统中的主打产品是DL380和DL385,前者基于英特尔平台后者基于AMD平台。而对于本次 Gen8系列的产品来说,由于英特尔的至强E5处理器有多种类别,因此在命名方式上也有所区分。在Gen8服务器中,p系列代表了基于至强E5-2600 处理器的产品,而e系列代表了至强E5-2400系列的产品。就本次我们测试的DL388来说,它是DL380系列的子型号,属于定制化的产品之一。

定制化的惠普DL388 Gen8双路服务器
定制化的惠普DL388 Gen8双路服务器

DL388p Gen8服务器正反面

新一代的Gen8服务器在设计上凝聚了惠普许多的心血,全新的造型和更多的功能让它成为了行业内的典范。就新一代的E5平台来说,惠普虽然不是唯一一家有着巨大改变的厂商,却提供了最多的功能和细节设计。

定制化的惠普DL388 Gen8双路服务器
定制化的惠普DL388 Gen8双路服务器

DL388p Gen8服务器细节设计

相比我们之前介绍的单路DL360p,DL388p的面板空间更大一些,也提供了足够的余量显示服务器状态,不再需要借助弹出的小窗口。在设计理念上,DL388p与DL360p一脉相承,这里我们就不做过多的介绍了。

定制化的惠普DL388 Gen8双路服务器

PCI-E插槽

按照C600系列芯片组的设计,支持至强E5-2600的主板需要搭配最高54条PCI-E通道,对于双路服务器来说,这样的扩展能力相当强悍。而且不要忘了,这是PCI-E 3.0的接口,速度比上一代提升了一倍。

定制化的惠普DL388 Gen8双路服务器

DL388p Gen8服务器所使用的电源

普DL388p Gen8服务器使用的是额定功率为750W的电源,2个互为冗余。对于新一代的Gen8服务器来说,电源这样的部件都采用了标准化设计,可以通用。

在我们之前的内容中,已经介绍过了新一代Gen8服务器的全新设计,包括集成的周期化管理、智能数据保护和自动能源优化。

惠普DL388p Gen8服务器设计介绍

惠普DL388p Gen8服务器内部拆解

作为双路机架,惠普DL388p Gen8服务器的内部看起来非常漂亮。标有蓝色的都是免工具的器件,而红色则代表了热插拔。

惠普DL388p Gen8服务器设计介绍
惠普DL388p Gen8服务器设计介绍
惠普DL388p Gen8服务器设计介绍
惠普DL388p Gen8服务器设计介绍

可以热插拔的机箱散热器

这个是Gen8服务器的散热位置,所有双路的服务器都是这样的设计。热插拔的风扇我们之前已经见过,但是这次我们看到的Gen8服务器有了明显的改善,增加了一个整排的模块设计。这个设计之前广泛被DELL采用,现在惠普也加入了队伍。

惠普DL388p Gen8服务器设计介绍

惠普DL388p Gen8服务器作为双路2U服务器,扩展能力更为出色。这里我们看到它提供了多种PCI-E插槽,最大可知道到54个PCI-E 3.0通道。

熟悉我们评测的朋友知道,这部分我们将进行的是被测服务器的主要部件介绍。虽然服务器这样的产品采用了定制化,并且可以随意选择配置,但介绍硬件规格依然是有必要的,这可以帮助大家更好的理解测试成绩及服务器的性能表现。

惠普DL388p Gen8服务器主要部件介绍

服务器使用的至强E5-2665处理器

至强E5-2665是一款定位于 级双路应用的产品。它的主频达到了2.4GHz,采用了8核心16线程,支持睿频2.0加速技术和8GT/s传输速率,TDP高达115W。

惠普DL388p Gen8服务器主要部件介绍
惠普DL388p Gen8服务器主要部件介绍

单条8GB DDR3 1600内存

惠普DL388p Gen8服务器主要部件介绍
惠普DL388p Gen8服务器主要部件介绍

采用南亚存储颗粒的阵列卡

从Gen8开始,惠普对于传统的阵列卡在外形上有了明显的改进。这里我们看到,它将所有的颗粒都整合在一起,以更小的体积出现。这样的好处除了表示差异化之外,也节省了服务器的内部空间。

对于性能方面的考察,我们主要分为子系统测试和应用性能测试。在子系统测试中我们按处理器、以及磁盘等各个子系统进行了分项测试,当然各子系统的测试成绩也是相辅相成,也需要其它子系统的支持,并非是完全独立的,只是对考察的子系统有所偏重而已。

处理器子系统测试

对服务器处理器子系统的考察,我们主要采用的是业界公认的SPEC 2006测试,该项测试通过对数十个典型应用程序的运行,来测试系统处理器子系统在应用中的整、浮点运算效率。SPEC 2006测试具有很好的开放性,因此在业界为广大用户所接受,可以利用这一公开的测试结果进行系统间运算性能的比较。CPUCPU

此外SiSoftware Sandra也有测试子项可用于处理器运算性能测试,其结果通常以每秒完成的指令数来表现。也可以用作不同处理器间运算效率的比较。

SPEC CPU 2006 v1.1

SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。

SPEC CPU测试中,测试系统的处理器、子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、和图形子系统对于SPEC CPU2006的影响非常的小。操作系统内存

SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

我们在被测服务器中安装了Intel C++ 11.1.034 Compiler、Intel Fortran 11.1.034 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2005 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。

和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64位的Windows Server 2008 R2 下完成,对于每个运算核心,最低配置1.5GB内存。

SiSoftware Sandra v2012

SiSoftware Sandra是一款可运行在32bit和64bit Windows上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的 Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2012对NUMA架构以及最新的Windows 7/Windows Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。

服务器平台信息
产品名称

惠普DL388p Gen8服务器

平台类型

Sandy Bridge-EP Intel

处理器子系统
处理器型号 至强E5-2665
处理器架构 Intel 32nm Sandy Bridge-EP
代号 Sandy Bridge-EP
处理器封装 Socket 2011 LGA
核心/线程数量 8/16
主频 2.4GHz
处理器指令集

MMX,SSE,SSE2,SSE3,
SSE4.1,SSE4.2,EM64T,VT-x,AES,AVX

外部总线

DMI

8GT/S

L1 Code Cache 8× 32KB 8路集合关联
L1 Data Cache 8× 32KB 8路集合关联
L2 Cache 8× 256KB 8路集合关联
L3 Cache 20MB 20路集合关联
主板服务器
型号主板 Intel
主板芯片组 Intel C600
北桥芯片特性 2×QPI
VT-d Gen 2
子系统内存
控制器内存 每CPU集成四通道R-ECC DDR3 1600
内存类型 8GB LR-ECC DDR3 1600 SDRAM ×8条
软件环境
操作系统 Microsoft Windows Server 2008 Enterprise R2 x64

惠普DL388p Gen8服务器的处理器主频较高,是目前我们测试过的产品中位数不多达到2.4GHz以上的8核心产品。测试环境中,Server 2008 R2是一个相当成熟的版本,虽然目前微软已经放出了2012版本的测试版,但鉴于之前我们测试的服务器一直采用老版,所以这次也没有更换。有关更多 Windows 2012的消息,我们会在过几天放出。

CPU-z软件显示信息介绍

至强E5-2665处理器信息

CPU-z软件显示信息介绍

20MB三级缓存

CPU-z软件显示信息介绍
CPU-z软件显示信息介绍
CPU-z软件显示信息介绍

64GB内存容量

AIDA64是一款测试软硬件系统信息的工具,它可以详细的显示出PC的每一个方面的信息。AIDA64不仅提供了诸如协助超频,硬件侦错,压力测试和传感器监测等多种功能,而且还可以对处理器,系统内存和磁盘驱动器的性能进行全面评估。

AIDA64软件识别信息
AIDA64软件识别信息
AIDA64软件识别信息

SiSoftware Sandra软件我们常用的处理器计算性能测试软件。在至强E3新出现的时候,我们将这款软件升级到了2011版本。而如今,这款软件最新的版本是 2012,也只有此版本可以更好的支持至强E5处理器。虽然是Lite版本,但是对于我们的测试来说并无大碍。

SiSoftware Sandra Pro Business 2012
产品名称

惠普DL388p Gen8

平台类型 Intel SandyBridge-EP
Processor Arithmetic Benchmark
处理器算术运算测试
Dhrystone ALU 438.47GIPS
Dhrystone ALU vs SPEED 141.81 MIPS/MHz
Whetstone iSSE3 267.43GFLOPS
Dhrystone iSSE3 vs SPEED 86.49MFLOPS/MHz
Processor Multi-Media Benchmark
处理器多媒体测试
Multi-Media Int x16 iSSE4.1 627.83MPixel/s
Multi-Media Int x16 iSSE4.1 vs SPEED 203.05 kPixels/s/MHz
Multi-Media Float x8 iSSE2 468.86MPixel/s
Multi-Media Float x8 iSSE2 vs SPEED 151.64 kPixels/s/MHz
Multi-Media Double x4 iSSE2 261 MPixel/s
Multi-Media Double x4 iSSE2 vs SPEED 84.41kPixels/s/MHz
Multi-Core Efficiency Benchmark
处理器效能测试
Inter-Core Bandwidth 56GB/s
Inter-Core Bandwidth vs SPEED 18.57MB/s/MHz
Inter-Core Latency(越小越好) 157.2ns
Inter-Core Latency vs SPEED(越小越好) 0.51ns/MHz
.NET Arithmetic Benchmark
.NET算术运算测试
Dhrystone .NET 23.08 GIPS
Dhrystone .NET vs SPEED 7.47 MIPS/MHz
Whetstone .NET 152.13GFLOPS
Whetstone .NET vs SPEED 49.20MFLOPS/MHz
.NET Multi-Media Benchmark
.NET多媒体测试
Multi-Media Int x1 .NET 105 MPixel/s
Multi-Media Int x1 .NET vs SPEED 33.95kPixels/s/MHz
Multi-Media Float x1 .NET 42.86MPixel/s
Multi-Media Float x1 .NET vs SPEED 13.86kPixels/s/MHz
Multi-Media Double x1 .NET 84.67MPixel/s
Multi-Media Double x1 .NET vs SPEED 27.38kPixels/s/MHz

从成绩来看,凭借着多核心和高主频,DL388p Gen8的成绩很不错,相比我们之前测试的6核心产品在计算性能方面提升了大约60%以上。

其实在刚才的SiSoftware Sandra 2012中可以看到一些内存测试的信息,不过还是比较少。至强E5平台提供了4通道内存,理论来说测试成绩也能够提高到一个新的台阶。

AIDA64内存性能测试

这是我们根据送测样机进行的内存性能测试。我们可以看到,单纯的内存来说,读取性能可以达到13800MB/s,写入可以达到6300MB/s。而借助于缓存的优势,写入成绩可以获得明显提升。

CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。

值得一提的是,原来的CineBench R10已经不能再适应如今的测试需要,因为R10只能支持24个处理器核心,只有R11.5能够支持最多48个核心(对于四路产品来说)。

CINEBENCH性能测试

CineBench测试对于主频相当敏感,我们可以看到单核心的成绩为1.22 pts,而在多核心中的成绩为19.91pts,超线程的虚拟核心成绩为16.34,符合了虚拟核心的表现。

SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

SPEC 2006是SPEC组织推出的一套子系统评估软件,它包括CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、和图形子系统对于SPEC CPU2006的影响比较小。

SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库、电子邮件和Web服务器等基于整数应用的多处理器系统的性能。

为了运行SPEC CPU 2006测试,我们统一安装了Windows Server 2008 Enterprise x64 Edition SP1,在主流的x64处理器下,原生64应用要比32位下快。我们还安装了Visual Studio 2005 SP1、 C++/Fortran Compiler 10.0.025编译器,对于支持SSE3指令集的处理器,我们使用了QxO编译指令进行了优化。编译时未使用SmartHeap商业优化库。

SPEC测试代表了绝大多CPU密集型的运算,包括编程语言、压缩、人工智能、基因序列搜索、视频压缩及各种力学的计算等,包含了多种科学计算,可以用来衡量系统执行这些任务的快慢。SPEC base测试包括浮点(fp)与整数运算(int)两部分。

整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。

SPEC CPU 2006处理器子系统性能测试

SPEC CPU 2006整数测试成绩

浮点运算包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。

SPEC CPU 2006处理器子系统性能测试

SPEC CPU 2006浮点运算测试成绩

相比上一代的Westmere-EP处理器来说,新一代的E5-2600平台在性能上提升巨大,这得益于新架构和新技术的应用。从这些数据来看,惠普DL388p Gen8服务器的计算性能非常强大,处理能力强劲。

评价观点:惠普DL388p Gen8服务器让我们看到了惠普在服务器应用中的强大实力,无论是在研发、设计还是最终表现出的性能,都非常强劲。这些来自于惠普一贯以来对于服务器的重视和深厚功底。新一代的Gen8实现了良好的操控性,同时配合更多的特色功能,成为了数据中心应用的不二之选。