服务器在线6月23日报道 最新的全球高性能计算机TOP500排行榜近日发布了,英特尔又迎来了一场胜利:共有375台基于英特尔架构的高性能计算系统上榜,占TOP500总数的75%,相比第30期榜单中70.08%的份额有了进一步提升。
此次TOP500榜单还首次引入能效数据,基于45纳米制程工艺的至强5400系列处理器表现突出,采用该系列处理器的系统占据x86系统能效表现前三名。
此外,四核处理器技术已成为TOP500主流,257套基于四核至强处理器的系统榜上有名,占据500台系统中的51.40%。中国大陆及台湾地区共有15台系统上榜,其中基于英特尔架构的有14台之多。一系列数据表明,英特尔正在扩大在全球高性能计算领域的优势。
当然,TOP500并不能完全代表整个高性能计算市场。如果把整个高性能计算领域形象地比作一个金字塔的话,那么,这块市场可以分为塔尖、塔中和基部三大块。位于塔尖的高性能计算机可以用TOP500排行榜中的机器尤其是TOP10系统来作代表,这些机器是针对超大规模并行应用的,一般来说其应用领域比较窄,但这些系统往往能带来体系架构和众多高端技术的创新与突破;
而塔中则是以成熟的集群系统为主,其关键问题包括如何进一步来提高系统的能效,如何更好利用刀片系统来构建集群等;而塔基代表的是广泛的中低端市场,大多以6-64节点的小规模集群为代表,这块市场的潜力很大,对于这类产品,关键是如何提高它的好用性、易用性以及性价比。
针对高性能计算市场,英特尔要做和正在做的事情显然不只是把芯片卖给OEM厂商,也不只是盯着那些位于塔尖的"巨无霸"系统。在近日的一次媒体沟通会上,英特尔公司服务器产品事业部服务器平台市场经理顾凡告诉记者,英特尔针对HPC的产品线非常完整,涉及到芯片、软件和平台等多个层面,覆盖了高中低等各个层面。
他谈到,根据英特尔的TICK-TOCK策略,今年第四季度英特尔会发布其全新架构的45纳米Nehalem处理器,由于采用了QPI互连技术和集成内存控制器,使得其针对高内存带宽的应用,性能会成2倍以上的提升。未来的Sandy Bridge还会把SSE指令集从128位向256位进行扩展,这样会使浮点运算性能再次实现两倍提升。这些无疑会在帮助英特尔在未来两三年内继续保持和扩大在主流HPC市场的优势。据透露,英特尔针对HPC的CPU出货量已经占到了其总出货量的20%。
除了标准化的至强和安腾处理器外,英特尔也正在进行超前的、针对特殊需求和超大规模并行计算的研究,如万亿次计算芯片,与CRAY合作进行千万亿次机研发,与SGI、NASA合作进行万万亿次机研发。
虽然说现在TOP500中千万亿次的系统已经出现,但英特尔的万亿次芯片项目似乎更有意思,它是在朝小的方向发展:通过一块芯片来实现万亿次每秒的计算能力和万亿TB的带宽。据顾凡介绍,在这方面,英特尔在芯片、平台和软件方面,全球有100多个研究项目正在开展。
在去年的IDF上,英特尔已经向业界展示了60W功耗的80核原型芯片,在可扩展性多核架构方面进行了有益的探索。当然,有了这么多内核,那就应该有足够的内存带宽、IO通信能力来保证有足够的数据可以让CPU去处理,英特尔对此会进行3D堆栈内存和光通信方面的研究。另外,在并行化编程方面,英特尔也正在进行线程感知执行环境的研究。英特尔还发现,仅仅只增加CPU核心数量不能保证性能线性增加,到16个核心以后,性能反而会下降,为此,英特尔将通过硬件级线程调度、缓存改进和指令集改进等技术手段来保证性能随着核心增多而不断提高。
当然,光有硬件是不够的,软件才是真正帮助用户把HPC应用起来的关键。在这方面,英特尔提供了从集群管理到线程优化的一些列工具,如编译器、数学函数库等。顾凡建议用户在选择通过加速器来提高HPC系统性能的方案之前,最好考虑一下能否通过软件优化来提高性能,以免造成大的浪费。也许只通过软件的并行化和调优就能实现几倍的性能提升。在这方面,英特尔的编译器、数学函数库等软件工具可以帮助用户从集群层面到线程并行化层面进行优化。
此外,英特尔在2007年6月还推出了Cluster Ready计划,对许多硬件厂商和软件厂商的产品进行兼容性认证,让用户在搭建集群方面不会那么费心。据了解,国内的硬件厂商也将会加入进来。
总之,面对一个年增长率在18-20%的高成长性市场,英特尔要想保持住持续领先的优势,不仅要从技术层面,如芯片制程工艺、处理器微架和服务器平台芯片组等加大创新力度,还要从市场层面,如生态系统建设、执行供货能力、工厂网络等方面下足功夫。