全球超算500强排名标准或将建立新衡量标准

自超级计算机诞生开始,人们就一直采用Linpack作为超级计算机性能的衡量标准。该基准作为衡量高性能计算能力的黄金标准,自1993年起就成为全球超级计算机500强排名的衡量基础。但如今,田纳西大学诺克斯维尔分校一位杰出的教授Jack Dongarra认为,这套标准将逐渐过时,需要建立一套全新的准则取而代之。Jack Dongarra是Linpack标准的创始人,其同时也负责全球超级计算机500强的排名工作。

那么到底为何要对标准进行修改?Dongarra认为Linpack已经无法跟上超级计算机需求的步伐,其必须进行更新以保持前进的脚步。

Dongarra在一份声明中表示:“计算机系统的Linkpack排名现在已经不能完全真实地反映应用程序的性能。”因此,Dongarra目前正和他的同事——来自位于新墨西哥州阿尔布开克市的桑迪亚国家实验室的Michael Heroux,共同研究一种新的衡量基准,其有望在下期全球超级计算机500强排行榜公布(即2013年11月)前出炉。

超级计算机的衡量基准需要经常更新,以保证能够正确反映出计算机使用方式的变化。Linpack标准最成功的一点是,其能够被使用长达30年之久,并且在这过程中其只做了一些细微的更新变动。据说Linpack的最新版本——高度并行计算基准测试(HPL 2.0),其在2008年就以发布,距今已有多年未作更新。

Dongarra解释称,Linpack衡量的是线性方程计算的速度和效率。随着时间的推移,应用程序对更复杂计算的需求已变得原来越普遍。这些计算要求有高带宽和低延时的环境,并且需要通过不规则模式访问数据。而Linpack无法测量这些更加复杂的计算程序。

“由于越来越多的应用程序采用微分方程计算方式,这个问题变得愈发重要并亟待解决。如果这个问题得不到解决,那么每一轮全球超级计算机500强排行榜的Linpack性能数据与真实的数据之间的差距将越来越大。”Dongarra如此说道。

于是,他和他的同事们开始研究一项新式标准,即高度共轭梯度基准测试(HPCG PDF Link)。这项新的测试方法旨在更好的关联现代主流应用程序中的计算和数据访问模式,同时也能提高整体的计算机性能,因为现在人们设计一些超级计算机的目的是为了能够在全球超级计算机500强榜单中名列前某,而非满足现实生活的需求。

Dongarra表示:“我们现在似乎为了设计一个具有良好Linpack性能的系统,而在实际上对应用程序的设计犯一些选择性错误,或是对系统增加一些不必要的组件或复杂机制。”

在其发表的新标准声明中,Dongarra和Heroux引用了位于橡树岭国家实验室的泰坦超级计算机作为例子。泰坦系统具有18,688个节点,每个节点都有一个16核、32GB的AMD Opteron(皓龙)处理器和一个6GB的Nvidia K20(图像处理单元)。“泰坦在2012年11月份的全球超级计算机排行榜中位列第一,当时的排行依据标准是高度并行计算基准测试HPL。然而,在泰坦的HPL测试过程中,皓龙处理器仅对测试结果起一部分的作用,所有的浮点计算和数据依靠的都是图像处理单元。相反,应用程序最初在移植到泰坦计算机时,他们通常独立运行在CPU上,并且会选择性的关闭图像处理单元的负载计算已达到加速计算机运行的目的。”

我们可以看到,采用这种衡量标准的测试结果错误反映了系统的真实性能。当然这点并不足为奇,因为只要存在衡量标准,就存在有人为因素,就可以对这些测试结果夸大化。

Dongarra希望“这种新式评分系统能够推动计算机系统的设计和实施的方向,以便提高应用程序的真实性能。”同时他还补充说,新的衡量标准将能够适应新兴的技术趋势走向,不再因循守旧。

也就是说,“Linpack基准测试对高性能计算机群来说,是一个十分合适的衡量标准。其体现出来的发展趋势、对促进计算机性能优化的激励作用以及对整个超级计算机行业的推动作用都是极为重要的。不过,Linpack现在已经无法真实反映出应用程序的性能,我们必须采用新一种标准来对其进行衡量。”

尽管如此,Linpack的时代还并未过去。HPCG将只是作为全球超级计算机500强榜单排行的另一个可用标准,其将根据“真实的”性能反映对该榜单进行重新排行。当然,最终还是希望HPCG可以完全取代Linpack,正式成为超级计算机的性能测试标准。

下一期的全球超级计算机500强榜单将在SC2013超级计算机大会上公布,其将同时采用Linpack和HPCG衡量标准。该大会将于今年11月在美国科罗拉多州丹佛市举行。