焦点分析:比拼极品飞车十 八核Xeon CAE工作站

随着中国经济高速发展,中国已经成为"世界制造中心",但我们的制造还大多数属于简单的浅层面。大部分产品是在国外研发设计,在国内生产。未来市场激烈竞争加剧,必然需要不断创新和追求完美的自主研发设计,在工程计算领域,用户对
CAE(计算机辅助工程)技术的信任度和依赖性越来越高,CAE应用范围和深度在不断拓展、延伸。单一或少量零、部件的CAE分析逐渐过渡到了系统级的仿真计算(如整车);单一物理场的研究演变多物理场耦合问题的研究;单一目标的求解发展为多目标、甚至直接探求问题机理的求解计算……工程计算的规模和复杂度正迅速膨胀,专业CAE应用对计算机性能的要求也相应提高。

 

演示截图

CAE包括的FEA(有限元分析)和CFD(计算流体力学)分析手段,在工程设计和分析中,已经成为解决复杂的工程分析计算问题的有效途径,现在从汽车到航天飞机几乎所有的设计制造都已离不开有限元分析和计算流体力学计算,其在机械制造、材料加工、航空航天、汽车、土木建筑、电子电器,国防军工,船舶,铁道,石化,能源,科学研究等各个领域的广泛使用已使设计水平发生了质的飞跃。随着计算机运行速度与存储容量不断地增加,CAE所能解决问题的尺度与复杂度也逐渐加大,目前已能够为用户解决各种复杂的工程问题。

CAE的HPC(高性能计算)应用软件使用最广泛是ANSYS、Fluent、CFX(流体)以及LS-DYNA(碰撞)等,用户使用这些软件进行复杂和大规模问题的求解,对计算机内存、处理器和I/O带宽的要求非常高。早期的数值分析软件是在大中型计算机上开发和运行的,后来又发展到以工程工作站(EWS,Engineering Work Station)上,它们都是用UNIX操作系统,所有这些成本太高,非一般单位的工程设计人员所能拥有的,现在不同了,四核64位处理器普及配合微软的高性能计算Windows系统,将极大地降低高性能计算的应用门槛,让更多的工程技术和研发人员有机会享受高性能计算的强大性能,高性能计算不再是高成本的时代了。

最快的超级跑车

这是一款目前世界最快的跑车,如果你驾驶这部在机场跑道和飞机等速起跑,那是多么爽快的事情,今天我们用最快的处理器-Xeon 5365,打造一款能够进行高性能计算的高速工作站,让这台机器的运算速度在工程设计发挥极致。这套配置是将当前服务器最高规格产品合理的搭配,构成一台高性能运算工作站。

参考配置

Intel V8高性能工作站的"亮点"

CAE对系统的浮点运算性能和内存带宽要求非常高,影响计算性能的主要环节是:CPU运算单元 → CPU二级缓存 → 前端总线 → 北桥芯片 → 内存 → 硬盘,每一个环节都不能忽视,基于最新英特尔酷睿2架构的四核Xeon处理器,拥有众多性能卓越的技术,包括基于Core架构的酷睿CPU核心,多达8MB的共享 L2 缓存、高达 1333 MHz 的前端总线。众多的先进技术实现了Intel Xeon 5365超强的计算性能,比老Xeon快400%,比双核Xeon快50%,为确保工作站高速高效还要合理的成本。

 

这套配置体现在:

CPU采用2颗Xeon 5365,8×3G频率、8M二级缓存、1333Mhz前端总线频率,整台工作站拥有八个计算单元,从而处理器的峰值速度达到3G×4×8=96Gflop/S,或近1000亿次/秒。

主板采用泰安S2696WA2NRF 支持最新四核Xeon5300系列,PCI-E16X显卡,四通道内存,支持8个SAS硬盘,支持RAID0、1。

内存容量8G ,4根2G内存构成四通道,有限元分析软件的计算速度提升完全靠大内存的支持,只有内存足够大,才能把所有数据一次放进内存,才能最快对数据计算和得到结果,否则当物理内存不足的时候,系统就会使用虚拟内存(磁盘部分作为虚拟内存),这样降大大降低性能。

硬盘采用目前最高转速15000转,SAS接口,充分保证速度读写对频繁数据访问要求,CAE应用在初始化、中间结果保存和计算结果输出时都会有密集的数据IO操作,而且目前并行计算程序的IO操作大多还是串行进行的,因此IO的性能经常是并行计算程序的瓶颈所在,所以SAS15000转这个目前最快的硬盘是非常必要的,如果资金允许,可以在通过RAID进一步提升读取速度,通过多块磁盘RAID,磁盘的IO速度可以成倍提高。

显卡Quadro FX560  一款中低端解决方案,计算产生的数据则需做可视化处理,经由适当的计算机绘图技术将结果表示出来。

将上述产品结合搭建的四核Xeon高性能计算工作站,满足了软件对硬件的高性能、经济实用,并具有灵活配置调整,相对于品牌工作站来讲配置更合理,价格更便宜,性能得到最大满足。

基于FEA/CFD工作站关键配件选型

CPU  四核 Xeon5365  4 x 3G / 8M L2二级缓存/1333Mhz前端总线

技术要点:

Intel宽位动态执行,支持数据流分析(Data Flow Analysis)、预测执行(Speculative Execution)、乱序执行(Out of Order Execution)及超标量(Super Scalar)等RISC处理器先进技术,每时钟周期可传递更多的指令,一个周期指令原来3条,提升到4条。

Intel高级数字多媒体增强技术,新一代Core架构拥有128Bit SIMD 算法及128bit SIMD双倍精准度浮动点运算, 并且只需要一个频率周期就能完成,执成效率提升达一倍,现时SSE指令集已经十分普遍地用于主流的软件中,包括绘图、影像、音像、加密、数学运算等用途,单周期128Bit处理器能力以频率以外的方法提升效能,令处理器拥有高效能的表现。

Intel高级智能高速缓存,在二级缓存方面,提供性能更强效率更高的缓存子系统。专为多核处理器做了优化。包括一个共享的二级高速缓存或内存库,它通过最大限度地降低内存"流量"减少能耗;并在一个内核闲置时,通过支持另一个内核利用全部高速缓存来提升性能。

主板  泰安S2696WA2NRF   采用5000X芯片组,支持双路四核Xeon

上面我们分析了有限元分析软件对运算的极高要求,为了保证计算的每个环节最高性能,市场满足这些要求的主板有Intel S5000XVNSAS、超微X7DA3、泰安S2696WA2NRF,从性能和品质讲,这三个型号应该不分上下,很多客户都是根据个人使用和了解,对某些品牌有所偏好,但是TYAN S2696WA2NRF这款主板是目前市场上唯一现货的工作站主板,TYAN的S2696WA2NRF是泰安众多工作站主板一款配置最高经典设计。

泰安这款S2696WA2NRF专为高性能计算要求而设计的工作站主板,它的配置完全满足有限元分析软件的最高要求。

下面是该主板技术参数:

支持目前最高规格的Intel 基于Core2架构的四核Xeon5365处理器

双路处理器和北桥之间是双独立总线结构,以重点解决前端总线方面的瓶颈,将具有1333MHz的处理器系统总线和核心逻辑来支持芯片,并且能够很好的支持两条这样的总线。加宽CPU总线带宽

5000芯片组示意图

内存采用目前最快的DDR2-667 FBD全缓冲,并通过优化可用数据带宽的使用率来提高系统性能

北桥芯片采用Intel5000X,北桥和内存之间四通道,北桥和内存最大带宽5.3GB/S×4=21GB/S

 

主板内存插槽

板载LSI 1068E,支持带RAID功能的SATA2/3G和SAS接口和许多其他功能,能够为您的系统搭配组建SAS RAID 0/1++/5/10,支持目前最快的SAS硬盘,SAS硬盘数量达到8个,SATA4个。

集成双千兆网卡,1394a火线接口,板载声卡,USB2.0接口,并且拥有多条PCI-E 插槽。 此外还具有PCI-X插槽。

性价比之王–丽台Quadro FX560专业显卡

有限元分析软件对图形功能的要求不是很高,只要对所计算的结果通过图形有所表现,基本就可以了,但是所有图形处理都是借助OPEN GL函数实现的,为此显卡方面推荐专业图形卡丽台NVIDIA Quadro FX 560是比较合适的,该卡配备128MB超高速GDDR3缓存、19.0GB/s内存带宽、128位内存总线,以及支持高分辨率(2048 x 1536)数字屏幕;下一代PCI Express总线架构在几何与填充率上有超过两倍的改善,为CAE专业用户带来高性价比的图像解决方案。 丽台Quadro FX 560不但有亲和力的价格,在功能/性能上也毫不含糊,提供完整且先进的功能与价值,兼顾精确度、效能表现和可程序化功能。

丽台NVIDIA Quadro FX 560

Quadro FX 560采用G73L芯片,显存容量128MB,位宽128bit,显存规格DDR3,插槽规格PCI-E,核心频率350MHz,显存频率600MHZ,Proe03 55.60,Ugs04 34.11,3Dsmax03 39.24。

硬盘方面

硬盘采用SAS接口,选用转速15000转最高规格,保证数据读取等待,如果再配上RAID功能,数据读写更快。

总结:

通过上述配件搭配,完全考虑到影响CPU运算速度的各个环节,CPU, 二级缓存,内存,以及之间的通道,比之老Xeon性能得到质的飞跃,DIY的最大好处,结合应用软件合理配置硬件,可以搭配出性价比最高的一套配置,相对于品牌要合理合算的多。目前很多设计研发单位在资金有限情况下,要求最小投入最大回报,这是一个明智的选择。

英特尔四核处理器逐渐成为高性能计算更强大引擎。高性能计算作为企业工程设计中的一个重要组成部分,成为核心竞争力的来源.扮演支持业务发展的重要角色。随着IT软硬件技术及其相关的配套系统的快速发展,高性能计算不再像以前那样高不可及,已经成为更加标准化和商品化的lT基础架构,进入门槛足够低,架构灵活性和可扩展能力更高。因此,国内企业应该把握住这一时机,加速应用高性能计算,籍此提升自身的核心竞争力。