占据TOP500七成河山 英特尔欲做HPC中的法拉利

DoSERV服务器在线:单壳车身结构、通风碟式煞车、TDI涡轮增压柴油机、全时四轮驱动这些技术现在看起来都已经是承载普罗大众的普通民用车技术中的简单搭配,但是,在几年,甚至十几年以前,这些技术却仅仅是栖身于F1方程式、勒芒耐力赛和WRC世界拉力锦标赛等高端赛车运动中的核心技术,虽然在大部分抵制赛车运动的人看来,像F1方程式赛车这样的极速运动,应该被彻底取缔,从而减少大量浪费的燃油与金钱,投入到对民用级轿车的安全性研发之上,但是,他们却忽视了一个决不可忽视的问题:我们所乘坐的民用车实际上早已经承袭了大量高端赛车运动所倾力研发的技术,而在未来几年中,这些高端赛车运动为了提升速度、节省燃油以及保证赛车手安全性的研发成果,还将持续的下移到我们的"真实生活"中来。

而在IT业界,也有一个类似于F1方程式地位的"排名赛",那就是高性能计算机(HPC),在高性能计算领域也有一个类似的高端评比,那就是"TOP500排行榜",这个由美国田纳西州立大学、美国劳伦斯伯克利国家实验室和德国曼海姆大学整理的高性能计算机性能榜单,通过近15年的发展,已经成为了业界最知名也是最权威的高性能计算机排行榜,每年6月和11月,全球的服务器厂商和超级计算机用户们都向"top500.org"这个简单的域名投以极大的关注。

6月18日,伴随着最高性能超过1千万亿次的超级计算机问世,最新一期的高性能计算TOP500名单出炉,而千万亿次的计算能力也让全球高性能计算由此正式进入了一个全新的阶段,但是,在英特尔(中国)有限公司服务器产品事业部产品经理顾凡看来,这千万亿次的时代跨越千万亿次固然意义非凡,他却觉得这其中却正在发生着更多不比寻常的变化,这种变化比千万亿次计算量在他看来更加意义非凡,而这种变化,与F1方程式赛车的技术下移有着异曲同工之妙。

英特尔的"普遍胜利"

从目前筛选出来的数据来看,英特尔继续扩大了其在高性能计算领域的领先优势:共有375台基于英特尔架构的高性能计算系统上榜,占全球前500名单总数的75.00%,相比第30期榜单中70.08%的份额有进一步提升。

此次TOP500榜单还首次引入能效数据,基于45纳米制程工艺的英特尔至强5400系列处理器表现突出,采用该系列处理器的系统占据x86系统能效表现前三名。此外,四核处理器技术成为提升此次TOP500整体性能表现的巨大推动力,257套基于四核英特尔®至强®处理器的系统榜上有名,占据500台系统中的51.40%。

从这些数据来看,英特尔成为了此次TOP500排行榜上的最大赢家,大量的高性能计算机都采用了英特尔处理器,而其中大部分都采用了四核处理器,这不仅标志着英特尔的一场胜利,同时,也标志着四核处理器的一场胜利。

顾凡表示,此次TOP500榜单显示,基于四核处理器的高性能计算系统已经占据市场主流,全部500台系统中基于四核处理器的达到283台,也正是因为多核处理器技术的大量应用,使得此次TOP500上榜系统的总体计算能力获得了空前提升–四核英特尔至强处理器在高性能计算系统中的广泛应用大大推动了TOP500上榜系统整体性能的提高,举例来看,本次榜单中排名最后的系统的性能在仅仅六个月前的榜单中可名列第200名。

顾凡在沟通会现场,展示了一个有关英特尔等式:

服务器持续领先=芯片制程工艺+处理器微架构设计+服务器平台芯片组+生态系统建设+执行能力+工厂网络

这位服务器平台产品经理表示,英特尔的成功来自于多个方面,他表示,HPC目前正在飞速的发展,对于英特尔来说,仅仅做芯片是远远不够的,英特尔还要做两件事情,一件事情是看清楚HPC未来的发展方向,了解这个市场会变成什么样子,未来会去向何方,另一件事情则是做好充分的准备,为未来提供最好的整体能力。

坠入凡间与绿色潮流

顾凡表示,高性能计算领域目前正发生着前所未有的变化,在他看来,刀片的普及化以及对于能效的要求,催生了这些变化,同时,更多的需求也在促进HPC的发展。"从科研到商用,从Performance到Productive,高性能计算正在发生着变化。"他表示,中间件的融合、绿色计算、微软在HPC领域的发展以及正在走向公关服务正改变着整个HPC的应用方式。

在沟通会上,顾凡展示了IDC的一组调查数据,根据调查显示,在整个市场金字塔中,从2007年到2012年大于50万美元的高端服务器系统市场的增长将远远低于中端市场的发展,虽然整体市场将从116亿美元增长到179亿美元,但是其中绝大多数的贡献将来自于25万美元到50万美元以及10万美元到25万美元这两个市场–2007年到2012年,高端市场的总体份额将仅仅增加9亿美元,而中端市场的增长则将超过50亿美元。

而在此次榜单中,共有288台高性能计算系统是专为行业应用设计,其中275台系统采用了英特尔架构,占总数的95.49%,从这个数据我们可以看出,大量的高性能计算机被用于了商业运算当中,而这种现象在顾凡看来将成为趋势,他表示,在任何一个金字塔式的市场里面,基石一定会做大,塔尖确实是突破性的技术,但是更重要的是使其更加低价,更加普及,英特尔一直关注着如何让高性能计算机做大,做到更为普及的应用上去。

顾凡希望,在勘探石油、金融交易以及拯救生命的医疗行业,高性能计算机能够更为普及,而通过英特尔的技术发展能够帮助类似医学成像、癌症检测等技术的发展,并更快的做出研究结果以拯救更多的生命,"这都是对我们有意义的。"他认为,高性能计算机的商用化将对于我们每一个人都有意义,而这正像是我们前面所言,F1方程式赛车对于我们生活的意义所在–这不仅仅是"高端游戏",而将是真真正正对我们有所裨益的技术发展,而这种技术发展也必将逐步的坠入凡间。

除了更加商用化、普及化的高性能计算机之外,绿色潮流也席卷而来,在此次榜单中,TOP500第一次加入了节能效率统计。主要是看该系统在运行一个典型HPC应用负载时的情况,而并没有考虑到外部制冷、磁盘、以及其他外部环境带来的能耗影响。通过这样的统计显示,进入TOP500前十的计算机中,平均能耗(Power consumption)为1.32 Mwatt,平均能效(power efficiency)为248 Mflop/s/Watt。前50名中,平均能耗(Power consumption)为908 Kwatt,平均能效(power efficiency)为193 Mflop/s/Watt。

具体到产品,本次排名第一的Roadrunner尽管运算速度最快,但其能效亦十分可观,资料显示,IBM QS22 Cell 处理器能效比达488 Mflop/s/Watt。基于英特尔的Harpertown 四核刀片系统也表现出色,IBM BladeCenter HS21平均能效(power efficiency)为265 Mflop/s/Watt;SGI Altix ICE 8200EX Xeon nodes (E5472)为240 Mflop/s/Watt;惠普Cluster Platform 3000 BL2x220为227 Mflop/s/Watt。这些系统的能效比都已超过了BlueGene/L(210)Mflop/s/Watt。

而在这些庞然大物中,我们也看到了低电压版至强的身影,对此,顾凡表示,低电压版的至强越来越多的出现在刀片服务器中,从刀片服务器的角度上来看,采用低电压处理器更为合理,因为刀片服务器本身就是力图高性能、高密度、低能耗的服务器产品,"在这里我要澄清一点,有些人认为同样速度的处理器,低电压版的型号性能要差一些,这是不对的,同样是2.3GHz的至强处理器,普通版和低电压版的能耗分别为80瓦和60瓦,但是性能其实没有区别。"顾凡指出,随着制程工艺和生产网络的逐步成熟与规模化,低电压版的至强处理的价格将会下降,并逐渐为绿色数据中心所青睐,"这也是金字塔尖上向下走的过程,因为应用最重要。"

英特尔:做HPC领域的F1玩家

无论是进入万亿级时代的芯片研究,还是大规模集群测试优化,英特尔都打算将自己打造成一支梦幻的高性能计算F1方程式赛车队,因此,英特尔展开了Terascale和Petascale计算研究项目,用以研究万亿次和千万亿次芯片–这里面所言的计算次数并不是一个高性能计算集群所完成的计算量,而是一颗芯片的计算量,是的,你确实没有看错。

顾凡表示,英特尔认识到,必须为未来的应用与市场进行前瞻性的研究,只有这样才能够不断满足用户的需求,并提供对用户最真实的长久承诺。事实上,就在前不久,NASA艾姆斯研究中心、英特尔和SGI联合开展了一项名为"昴宿星"(Pleiades)的计划,预期于2009年前开发出峰值性能为千万亿次(1 Petaflops,即1000Teraflops,每秒可执行一千万亿次操作)的计算系统,并在2012年前将这一数字提高到万万亿次(10 Petaflops,每秒可执行一万万亿次操作)–这是英特尔在未来4年的研究计划,而在未来10年,英特尔打算创造出80核的处理器,创造出整合10~100个小核心的强大计算单元,创造出计算能力达到Petaflops的中央处理器。

而中央处理器在英特尔看来,还仅仅是车队的发动机而已,除了发动机之外,一个具有竞争力的车队与赛车还应包括车身、轮胎、控制单元以及整套的服务人员与流程,英特尔自然不会忘记这一点,顾凡表示,英特尔提供了高性能计算与集群方面的工具集以及线程工具,这些工具能够创建、分析、优化和部署集群应用,帮助更多人并行化应用,并在为更多的额外设备"付钱"之前就找到软件调优的空间–"我们的目的是把用户教会,而软件是不卖钱的,我们的目的只是让生态环境发展起来。"

与此同时,Cluster Ready合作联盟也正在逐步的展开,包括BULL、泰安、SGI、戴尔等厂商在内的服务器厂商以及大量的人家合作厂商,正在与英特尔合作,建立一个被称为"Cluster Ready"的联盟,英特尔对加入联盟的厂商的认证系统和注册应用程序进行认证,并提供给最终用户,同时提出简化HPC系统和软件部署的优化解决方案,从而更加降低HPC的门槛。

2007年,英特尔借助四核处理器成为了处理器市场的大赢家,而在TOP500中,服务于商业应用的英特尔IA架构高性能计算机已经达到了275台–超过一半的数量揭示了一个简单的道理:高性能计算机将迎来IA架构的黄金年代,而且也将逐步从那些超级计算中心与研究机构中走出来,在越来越多的商业应用中体现其自身价值,英特尔希望,在今后以及更远的未来,通过Tick-Tock的发展模式,通过Nehalem、Westmere以及SANDY Bridge的一代一代的接力,将英特尔在高性能计算上的优势持续保持下去,而更加"平民化"的高性能计算,恰恰给了英特尔一个绝好的机会。