优点
支持双核Opteron 2000系列处理器
支持更低功耗的DDR2内存
良好的扩展性,支持多种主流扩展卡
板载SCSI控制器和双GbE网卡
缺点
附带驱动程序不完备
在今年的9月底,IT168评测中心率先在国内发布了AMD Opteron 2000处理器的性能测试报告,该报告就是基于曙光A620r-F服务器测试样机所得的。最近我们收到了曙光公司送测的正式量产的A620r-F服务器。
从外观上看,天阔A620r-F服务器正式机型并无变化:前面板上提供了6个可热插拔的SCSI硬盘扩展位,在硬盘扩展位的右侧是5.25英寸光驱,其上方预留了安装软驱的位置。在前面板的最右端有开机按钮、复位按钮、ID指示灯按钮,还提供了电源指示灯、磁盘状态指示灯、ID指示灯、两个网卡指示灯和两个前置USB接口。
从服务器的后部看到,送测样机采用了单电源供电,提供了PS/2键盘和鼠标接口、1个百兆以太网接口(RJ45)、2个USB接口、2个千兆以太网接口(RJ45)、1个串口(9pin)和1个VGA接口(15pin)。另外,还预留了7个PCI设备的扩展位置–其中一个扩展位已经被RAID卡占用。
打开曙光A620r-F服务器的上盖可以看到系统风扇是4个平均转速在5000RPM左右的8cm风扇,它们产生的气流会依次经过处理器、内存模组、PCI扩展卡,然后离开服务器。两颗AMD Opteron 2000系列处理器均采用了主动式散热器,以进一步确保处理器稳定工作。这次送测正式机型同之前我们所测试的样品的散热解决方案均是相同的,甚至是芯片组的散热片也是相同的。
曙光A620r-F服务器采用了TYAN Thunder h2000M (S3992)主板,这款主板基于Broadcom HT2000+HT1000芯片组设计,可以支持AMD最新的Opteron 2000系列处理器,本次送测机型上安装了两颗uPGA 1207封装的双核Opteron 2212处理器,其主频为2.0GHz,整合了128KB L1缓存(64KB数据缓存和64KB指令缓存)和1MB x 2二级缓存,支持1GHz 16bit HyperTransport总线。
Opteron 2000系列处理器均整合了128bit内存控制器,目前可以支持Registered ECC DDR2 667MHz内存。从上图可以看出,每个处理器配置了8条240pin 1.8v DDR2插槽,理论上最大可支持64GB的内存。送测机器中配置了4条Ramaxel 1GB 2Rx8 PC2-3200R-333内存。
曙光A620r-F服务器具有相当不错的扩展性,提供了2条PCI Express x016插槽(均为x8信号)、2条PCI-X 133/100插槽、1条PCI-X 100MHz插槽、1条PCI 32-bit/33MHz v2.3插槽和1条TYAN "TARO" SO-DIMM插槽。这些扩展插槽涵盖了目前主流的扩展卡类型,相信可以满足不同用户的需求。
TYAN Thunder h2000M (S3992)主板板载了adaptec AIC-7902W SCSI/RAID控制器,支持RAID 0/1/10模式,可低成本实现对于SCSI设备的支持。更可以选配诸如M7901/M7902 Ultra 320 SCSI TARO卡来升级到更高级的RAID模式。主板上还提供了4个SATA 1.5Gb/s接口,这是由HT1000所整合的SATA控制器所支持的,该控制器功能相当的强大,可支持NCQ,并提供了RAID 0/1/5/10等多种模式。
本次送测机器配置了Adaptec 2130S SCSI/RAID卡,可支持RAID 0/1/10/50/JBOD等多种磁盘阵列模式。同时,该机器还配置了3块FUJISU MAT3073NC 73GB SCSI硬盘,因此在测试中我们组建了RAID 5磁盘阵列。
测试平台和测试方法
曙光A620r-F服务器配置 |
|
主板 |
TYAN Thunder h2000M (S3992) |
芯片组 |
Broadcom HT1000+HT2000 |
驱动程序 |
5.2.3790.1830 |
处理器 |
AMD Opteron 2212 x 2 |
主频 |
2.0GHz |
HTT |
1GHz |
L2容量 |
1MB x 2 |
处理器设置 |
AMD PowerNow! Disable |
驱动程序 | AMD Opteron Processor Driver 1.3.2.16 Machine Check Analysis Tool 1.0.1.21 |
内存 |
Ramaxel 1GB 2Rx8 PC2-3200R-333 |
SPD | 3-3-3-8 @ 200 MHz |
总容量 | 1GB x 4 |
配置 | 2通道 x 2 |
磁盘控制器 |
Adaptec SCSI RAID 2130S Controller |
硬盘 |
FUJISU MAT3073NC |
驱动程序 |
5.2.0.11518 (9/14/2006) |
磁盘设置 |
3块硬盘组建为RAID 5,分为两个分区,均为NTFS格式,系统默认簇,主分区20GB,其它分为扩展分区,共享文件夹、磁盘测试均在格式化后的扩展分区上进行 |
操作系统 |
Microsoft Windows 2003 Enterprise Server R2 5.02.3790 (Service Pack 1) |
网卡 |
Broadcom NetXtreme Gigabit Ethernet (BCM5780整合GbE) |
驱动程序 |
9.3.28.0(1/23/2006 ) |
我们在上述配置的服务器上分别安装了Microsoft Windows 2003 Enterprise Server R2 5.02.3790 (Service Pack 1),正确安装了各个硬件的驱动程序,确保服务器工作在最佳的状态。
我们所使用的评测项目如下:
SPECCPU2000 v1.2
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试。然后我们根据被测系统实际可同时处理的线程数量,设定用户数量,分别运行SPEC base和SPEC rate base测试的结果(其中SPEC base代表系统执行某个任务的速度,而SPEC base rate测试代表系统可以同时处理任务的能力)。
ScienceMark v2.0 Membench
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
IOMeter 2004.7.30
IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。
Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量
Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力
Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量
Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力
SiSoftware.Sandra.SP1 v2007
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。今年该软件推出了2007版,该版本新增了4项基准测试,包括Power Management Efficiency、Memory Latency、Physical Disks和CD-ROM and DVD这四个项目。另外,它还对于原有的几个基准测试模块进行升级,比如在Arithmetic benchmarks中增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
WebBench v5.0
WebBench是针对服务器作为Web Server时的性能进行测试,我们在被测服务器上安装了IIS6.0组件,以提供测试所需的Web服务。在测试中我们开启了网络实验室中的56台客户端,分别使用了WebBench 5.0内置的动态CGI以及静态页面脚本对服务器进行了测试。
静态测试是由客户端读取预先放置在服务器Web Server下的Web页面(wbtree),这项测试主要考察的是服务器磁盘系统以及网络连接性能。我们使用了实验室中的56台客户端,配合Static_mt.tst多线程静态脚本测试向被测服务器发送请求。
动态测试偏重于对服务器CPU子系统的性能测试,它对于Web服务器提供了足够的负载。我们将一个C语言编写的CGI源文件Simcigi.c编译为Simcgi.exe,并将其作为动态测试中的CGI脚本。在测试过程中,每台安装了WebBench客户端软件的PC,会在300秒的时间内持续向服务器发送CGI请求,而控制台会纪录并汇总服务器所响应CGI请求的数据。CGI测试的成绩高低,主要取决于服务器处理器子系统性能的优劣。处理器子系统包括CPU、内存以及内存控制器,CPU频率、缓存以及内存容量大小和内存带宽,都会影响该项成绩。
NetBench v7.03
NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。
Benchmarkfactory 4.6
大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL2000 SP4来测试不同的硬件平台在数据库应用中的表现。
我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。
系统功耗监测
我们使用UNI-T UT71E智能数字万用表对于被测服务器系统的整体功耗进行了监测,利用随机附带的接口程序,我们可以记录被测服务器任意时间段内的功率变化.
处理器性能测试
SPECfp rate_base2000 |
|
---|---|
开启线程数量 | 4 |
168.wupwise | 49.5 |
171.swim | 40.6 |
172.mgrid | 38.5 |
173.applu | 35.1 |
177.mesa | 43.8 |
178.galgel | 69.8 |
179.art | 44.9 |
183.equake | 45.1 |
187.facerec | 50.2 |
188.ammp | 40.3 |
189.lucas | 48.5 |
191.fma3d | 43.6 |
200.sixtrack | 25.1 |
301.apsi | 46.6 |
总分 |
43.4 |
SiSoftware.Sandra.Enterprise.v2007 Sp1 |
|
Processor Arithmetic | |
Dhrystone ALU(MIPS) | 28917 |
Whetstone iSSE3(MFLOPS) | 24470 |
Processor Multi-Media | |
Integer x4 aEMMX/aSSE | 74871 |
Floating-Point x4(it/s) | 81443 |
整数性能测试中包括11个C程序和1个C++程序(252.eon),它们分别代表数据压缩(164、256)、电路布线(175)、C编译器(176)、 最低成本网络流解算机(181)、象棋模拟程序(186)、自然语言处理(197)、光线追踪(252)、Perl应用(253)、计算机群论(254)、面向对象的数据库应用(255)等应用。
浮点性能测试中包含了14个程序,分别代表量子色动力学(168)、浅水模型(171)、3D势场多栅格解算器(172)、抛物/椭圆偏微分方程(173)、3D图形库(177)、流体动力学(178)、神经元网络(179)、有限元模拟:地震模型(183)、面部识别(187)、计算化学(188)、数论(189)、有限元模拟:碰撞(191)、粒子加速器(200)、污染物扩散(301)。
曙光A620r-F服务器采用了2颗AMD Opteron 2112处理器(2.0GHz)和1GB x 4 PC3200 DDR2内存,单就SPECfp测试结果来看,该服务器的浮点性能低于双路Xeon 5110处理器的服务器的性能。
Sisoftware Sandra 2007处理器测试包括算术运算性能测试和多媒体运行性能两个部分。同主频相近的双Xeon 5120处理器性能对比,配置了双路Opteron 2112处理器的服务器的Whetstone iSSE3得分是有优势的,而其它的三项测试结果均明显的落后。同双Xeon 5110处理器的性能对比也是如此,只是差距小了一些。
缓存内存性能测试
ScienceMark Membench |
|
L1带宽 | 22929.81 |
L2带宽 | 7260.15 |
内存带宽(MB/s) |
4295.38 |
L1 Cache Latency (ns) |
|
32 Bytes Stride |
1.50 |
L2 Cache Latency(ns) |
|
4 Bytes Stride |
1.50 |
16 Bytes Stride |
2.51 |
64 Bytes Stride |
8.52 |
256 Bytes Stride |
6.02 |
512 Bytes Stride |
6.52 |
Memory Latency(ns) |
|
4 Bytes Stride |
2.01 |
16 Bytes Stride |
7.52 |
64 Bytes Stride |
30.08 |
256 Bytes Stride |
74.19 |
512 Bytes Stride |
77.69 |
Algorithm Bandwidth(MB/s) |
|
Compiler |
1899.46 |
REP MOVSD |
1920.74 |
ALU Reg Copy |
1950.16 |
MMX Reg Copy |
2062.14 |
MMX Reg 3dNow |
3948.13 |
MMX Reg SSE |
4292.58 |
SSE PAlign |
3389.02 |
SSE PAlign SSE |
4293.64 |
SSE2 PAlign |
3389.12 |
SSE2 PAlign SSE |
4295.38 |
MMX Block 4kb |
3829.08 |
MMX Block 16kb |
4195.49 |
SSE Block 4kb |
3901.32 |
SSE Block 16kb |
4228.2 |
SiSoftware.Sandra.Enterprise.SP1 v2007 |
|
Memory Bandwidth | |
RAM IntBuff iSSE2(MB/s) | 9512 |
Assignment | 9401 |
Scaling | 9392 |
Addition | 9635 |
Triad | 9623 |
RAM FloatBuff iSSE2(MB/s) | 9470 |
Assignment | 9358 |
Scaling | 9347 |
Addition | 9583 |
Triad | 9595 |
由于AMD Opteron 2000系列处理器同Intel Xeon 5100系列处理器在微架构上有了很大的不同,因此其L1、L2带宽有着很大的区别,ScicenMark v2.0 Membench测试结果显示一般的双路Xeon 5120处理器的L1带宽为52000 MB/s左右,L2带宽为15000 MB/s左右。虽然这样,但是Opteron系列的L1延迟和L2延迟还是具有明显优势的。
曙光A620r-F服务器每颗Opteron 2112处理器配置了双通道DDR2-400内存,ScicenMark v2.0 Membench测试结果显示其内存带宽为4300 MB/s左右,高于Xeon系统在这个测试项目的得分.
Sisoftware Sandra SP1 2007 Memory Bandwith测试可以很好的反应出来Opteron内存子系统架构上的特性–每个Opteron 2000处理器配置了双通道DDR2内存,因此结果几乎是一个内存控制器的2倍。因此,回头看ScicenMark v2.0 Membench测试结果,它应该是测试了一个内存控制器的效能。
在线性内存延迟方面和随机内存延迟方面,我们发现配置了双路Xeon 5120处理器的系统优于配置了双路Opteron 2112处理器的曙光A620r-F服务器。在缓存内存带宽测试方面,当测试数据块小于4MB时,测试结果依然是Xeon 5100系统占据优势,当测试数据块大约4MB时,测试结果则是配置了双路Opteron 2112处理器的曙光A620r-F服务器占据优势,这说明基于AMD Optereon 2000系列处理器的系统在内存性能上是具有优势的。
磁盘性能测试
曙光A620r-F服务器的磁盘子系统由Adaptec SCSI RAID 2130S磁盘控制卡和3块FUJISU MAT3073NC 73GB SCSI硬盘组成。其中,Adaptec 2130S磁盘控制卡板载128MB缓存,支持RAID 0/1/10/5/50/JBOD等多种磁盘阵列模式,是一款兼具功能和性能的RAID卡。在测试过程中,我们将其配置为RAID 5模式。
从IO测试曲线来看,曙光A620r-F服务器的磁盘子系统的读取IO性能和写入IO性能都非常优秀,其中读取性能达到了74100 IOps,写入性能也达到了66100 IOps,读取和写入IO操作处理能力相当的平均。从吞吐量测试曲线来看,该磁盘子系统的峰值读取吞吐量可达158MB/s,写入吞吐量则达到了75MB/s以上。
该磁盘子系统兼具较高的IO处理能力和吞吐量,并且读取和写入较为平衡,可以判断曙光A620r-F服务器在以下的文件服务器应用测试中会有较好的表现。
文件服务器性能测试
曙光A620r-F服务器其主板采用了板载Broadcom NetXtreme Gigabit Ethernet网卡,测试结果显示其吞吐量在887-901Mbps之间。
NetBench 7.03 Ent_dm.tst测试脚本模拟的是企业级文件服务器应用,它不但要求被测服务器的磁盘子系统可以提供足够的吞吐量,还需要其具有较高的IO处理能力,并且需要较为平衡的读取能力和写入能力。测试结果显示其吞吐量可以达到1050Mbps(24个客户端接入时),测试结果相当的不错。
Web服务器性能测试
Web服务器测试分为静态应用测试和动态应用测试,IO能力对于静态应用的性能有明显的影响,而处理器计算能力、缓存内存效能则对于动态应用的性能有明显影响。
静态测试曲线显示,曙光A620r-F服务器最高可处理182000个左右的静态请求,只有进一步提升网络吞吐量,才能处理更多的静态处理请求。动态测试曲线显示,曙光A620r-F服务器每秒可处理6624个动态请求,其性能高于双Xeon 5110配置的服务器,略低于双Xeon 5120配置的服务器。
数据库服务器性能测试
我们在被测服务器上安装了Microsoft SQL 2000 SP4,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟800个用户,并且以8个一组依次增加,在这个数据库中进行查询、添加、删除、修改等操作。在测试期间,数据的吞吐量很小,因此磁盘吞吐量和网络吞吐量都不会成为瓶颈。
曙光A620r-F服务器测试曲线非常的规则,当用户数量超过300个以后,其每秒钟可处理操作始终维持在40000 TPS水平上,峰值出现在328个用户同时接入时。该服务器的平均处理能力同双路Xeon 5110配置的服务器相当。
服务器整体功耗
我们利用UNI-T UT71E智能数字万用表和相配套的软件对于对于被测服务器在几种不同的状态下的功耗进行了监测,主要包括如下项目:
P1:连接电源但不开机状态
P2:系统启动完毕,5分钟内无动作,但不休眠
P3:系统启动完毕,处理器满载、磁盘以最大吞吐量工作
曙光A620r-F服务器主要硬件配置包括2颗AMD Opteron 2112处理器、4条1GB DDR2 PC3200内存、1张Adaptec SCSI RAID 2130S扩展卡、3块FUJISU MAT3073NC 73GB SCSI硬盘、4个机箱风扇和2个处理器散热风扇。它所使用的电源型号为EMACS P2M-6601P,该电源最大输出功率为580瓦。
我们测试显示,曙光A620r-F服务器在接通电源但是不启动的状态下,其功耗仅为6瓦,而进入系统之后常时间无动作(不启用节电模式),系统功耗为196瓦,处理器满载同时让磁盘子系统工作在最大吞吐量模式下,此时系统功耗达到了248瓦。
IT168评测中心观点
曙光A620r-F服务器采用了配置灵活同时又极具扩展性的Broadcom HT1000+HT2000服务器芯片组,使得服务器本身也具有了这些优势。曙光A620r-F服务器不仅可以支持最新的AMD双核Opteron 2000系列处理器,还配置了16条DDR2 DIMM,最高可配置32GB内存。这款服务器还提供了2条PCI Express x016插槽(均为x8信号)、2条PCI-X 133/100插槽、1条PCI-X 100MHz插槽、1条PCI 32-bit/33MHz v2.3插槽和1条TYAN "TARO" SO-DIMM插槽。这些扩展插槽涵盖了目前主流的扩展卡类型,使得服务器本身具有极好的可扩展性和灵活性。
此次送测的曙光A620r-F服务器采用了贴近主流的硬件配置,两颗主频为2GHz的AMD Opteron 2112处理器,4GB PC3200 DDR2内存,1张Adaptec SCSI RAID 2130S扩展卡、3块FUJISU MAT3073NC 73GB SCSI硬盘。因此其性能也较为平衡,计算能力接近于双Xeon 5110配置的处理器,磁盘子系统的性能相对更好一些。
曙光A620r-F服务器标配服务器中除了提供必需的驱动程序光盘、用于安装在机架上的导轨和耳片、电源线之后,还提供了Turbolinux 10 Server操作系统,这在我们所评测服务器中并不多见。不过,其驱动程序光盘并没有包括AMD Opteron平台所必需的最新的AMD CPU Driver,在部署操作系统的时候并不太方便。