现在,如果你准备购买一个每秒钟运算15 Giga浮点运算(GFLOPS)的系统,可能只需要约750美元,相当于每GFLOPS价值为50美元。如果你对这个数字有怀疑,那么你可以查询配置最低的Intel Core 2 Duo (E6550)系统的价格,其配置为1GB RAM、250GB硬驱、DVD,同时装载Linux操作系统。然后用Goto库运行HPL基准,你就会发现它的运算速度至少15 GFLOPS。的确很令人惊讶,只需花费如此低的价格就可以拥有如此强大的运算能力。
有些观点会有助于理解这种HPC成交商品。如果你能在1993年制造出这样的机器,那么它一定会名列Top500的第七名。而之后就是Oak Ridge国家实验室512处理器Intel Paragon (Intel i860处理器运行频率50 MHz)。你能猜出Paragon那时值多少钱吗?我想会是很高的七位数,甚至可能更多。
我们再来讨论一下功率吧。虽然我并没有确切的Intel Paragon功耗值,但是我还是测算了运行HPL的Core 2 Duo的功率。运行基准时,这个系统每个GFLOPS只消耗了6.7瓦的微小功率。而Intel Paragon的功耗比这个数值大得多。
当然,如果你准备构建一个真正的HPC簇,那么花费会要高一些,因为“服务器级”的硬件要比低价位的台式机市场的硬件要贵一些。但是性价比方面的提高却不可同日而语。根据IDC预测,在接下来的3~5年内,HPC簇系统预期的AGR会超过10%。
这对所有的HPC行家来说都是个巨大的好消息。但是有一个问题,“我们该如何利用这些FLOPS”?与过去的那些年相比,我的台式机可能都能用来发掘石油、合拢蛋白质、设计喷气式飞机或其他更酷的HPC活动。
但是在我们因FLOPS欢天喜地之时,我还是将其深化。其实对我们来说更重要的是,‘我们该如何利用并行FLOPS’。对,就是“并行”这个关键词。他能记忆簇,而现在,又是多核。并行改变了这一切。很快我们就会因一个处理器(单核)时钟的缓慢爬升得到提升的性能。我们还是要抓住并行这个关键,但是抓住它就意味着要付诸努力。
幸运的是,HPC世界很多并行方面的努力都已尝试。很多重要的应用程序现在都运行在簇上(簇都分布在存储器并行计算机上),也可以运行在多核系统的某些性能。多核系统都是共享存储器的并行计算机,通常是指对称多处理器(SMP)系统。在SMP系统的簇上运行是下一个挑战。一旦达到了令人满意的级别,我们就能解决过去同样问题中出现的FLOPS。多核方法的确打破了单一CPU/存储器节点之间通过快速互联进行通讯的旧模式。因此有必要进行一些非寻常的调整。
对于HPC开发者来说,更多的并行FLOPS通常会意味着更快速(也就是多个解决方案)和/或更佳的解决方案。由于并行方案的效率/可扩展性可能因多核向更好或更差的方向发展,因此,簇的设计会比过去更复杂。由于独立的SMP电源要代替两个插座/单核系统,因此需要对原来的假设进行测试。要注意,当千兆以太网(GigE)和一个开关一旦为基本的两个核心节点服务,互联网则比过去更为重要。将来,需要无限制波段和Cisco等公司提供的10 GigE解决方案对大量的多核节点的要求提供服务。
那么其他方面又如何呢?并行方面的努力会阻碍HPC簇的主流应用吗?由于没有其他可替换物,因此,并行方式会缓慢发展成为主流。Intel、IBM和其他公司会提供有助于移动的工具。但是,在FLOPS领域还有大量空间可以进行创新。毫无疑问,FLOPS越高,越有助于将工业方面的竞争转向教育,但是传递FLOPS要先从几个方面进行努力。
由于我已努力勾画了多核簇FLOPS美好前景,因此我会继续选择将此事更注重实效。我们要面对这些挑战,向所有的人打开FlOPS闸门。我们对现代HPC簇的目标就是这点。我们要帮助你们驾驭HPC的美好前景,做出正确的决定。