服务器在线IDF 2009现场报道:英特尔软件产品开发总监James Reinders在4月8日下午于北京富丽万丽酒店举行的2009年英特尔信息技术峰会的技术专题讲座会场进行了题为《借助英特尔至强5500系列处理器和英特尔软件工具,充分释放高性能应用性能》的技术演讲,英特尔公司的高性能计算支持经理何万青在座予以了支持。
James Reinders的演讲共分为四个主要部分,英特尔高性能计算平台与工具创新、英特尔至强处理器5500上的应用特征分析、英特尔至强处理器5500上的应用优化以及英特尔万兆网推动HPC集群性能。
James Reinders表示,英特尔正以处理器平台创新持续满足高性能计算市场的需求,未来新的英特尔SnadyBridge微架构将能够更好的满足高性能计算的需求,他尤其提到,QPI技术比前一代提供高达两倍的互联带宽,而集成内存控制器相比上一代处理器提供高达1.5倍的峰值带宽,除此以外,智能加速技术、超线程技术以及更多的自适应能效技术也同时为HPC集群注入了高智能。
以至强5500为例,HPC将获益于相比前一代架构增至高达4倍的内存带宽,并未单线程应用提供高于15%的性能提升,而在软件优化方面,英特尔提供了包括VTune性能分析、多种语言编译器、线程检查器、消息检查器、性能分析器、线程剖析器在内的分列于架构、实现、可信和性能等方面的工具。
James Reinders谈到,英特尔服务于两类开发群体的两条开发产品线分别面向获取最大并行性能和获取最大并行开发效率的用户,而获取最大并行开发效率的用户,如在Windows平台上开发VC++应用的Intel Parallel Studio已经进行了Beta测试,预计在2009年上半年发布。
他应用高性能计算快速特征分析,如Cycle统计、CPI值、内存访问、缓存效率、NUMA、SMT、IO粒度/延迟、MPI粒度/扩展性等方面来评价HPC平台,并以如下图的性能特征雷达图来综合比较不同处理器对应用的适用性。
在至强5500上,英特尔采用了SSE4.2,该新的指令集被嵌入在Nehalem何新忠,包括STTNI、ATA、POPCNT、CRC32等新特性。用以加速字符和文本处理器、加速搜索、加大在大型数据库中搜索数据的速度,并支持了新的通信领域的指令。
英特尔智能加速、超线程及NUMA特性也是Nehalem平台的优异特性,打开NUMA开关之后,James表示可以提高大部分高性能计算的性能,而智能加速技术的Turbo开关可以提高CPU密集型(100%CPU使用率)高性能计算程序的性能。
下图为典型数字气象预报应用特征(应用雷达图):
James在演讲中同时谈到了如何对MPI进行性能调优、根据应用通信模式调整MPI拓扑(粗粒度调优)、通过ITAC函数分析精确优化MPI性能(细粒度调优)等调优方法。
在万兆以太网的优势部分,他谈到,至强5500可扩展支持多个万兆以太网端口(10GbE),而新的英特尔82599万兆网控制器芯片+至强5500能够提供更低的总体成本,82599万兆网控制器芯片提供了双端口的全万兆带宽、I/O虚拟化、对FCoE的支持及iSCSI的硬件加速以及LAN主板集成设计。
James表示,英特尔的以太网技术支持iWARP技术,NerEffect的iWARP技术为服务器集群保证了高吞吐、低延迟的以太网络连接,他同时介绍了iWARP在石油行业应用的优势。
在最后的总结中,他表示,至强5500的用户需要充分考虑SSE4.2的向量优化实现以优化关键循环、而集群性能很大程度上取决于MPI优化的粒度,并建议使用英特尔Cluster Tools进行调优,同时,万兆以太网将推动HPC扩展发展。