8月7日,联想公司与中国科学院计算机网络信息中心(以下简称“中科院网络中心”)在京举行了百万亿次高效能计算机系统签约仪式。中科院网络中心委托联想公司研制的百万亿次高效能计算机系统,将成为“十一五”中国科学院信息化建设专项“超级计算环境建设与应用”项目总中心三层网络架构的顶层架构主机,同时也将成为国家863计划“高效能计算机及网格服务环境”重大项目的北方主节点。该项目将基于英特尔®架构处理器构建,为全国数百个科研院所和机构提供强大的高效能计算、服务、存储资源,进一步提升我国科技界超级计算的应用水平。
据悉,此次联想深腾7000百万亿次高效能计算机的节点机将采用数千颗多种类型的英特尔®架构处理器,涉及双路至强®服务器处理器、多路至强®服务器处理器和安腾®服务器处理器。该设备投入使用后,将广泛服务于科研、教育、气象、石油、医药、环境等核心行业和领域,支持国家各行业的建设与发展。中科院选择基于英特尔®架构的服务器处理器平台,是对英特尔一直以来对国内高效能计算发展的认可,证明了英特尔服务器处理器架构拥有出色的性能和能效表现。
英特尔处理器为高效能计算注入强大动力
全球高效能计算市场中有国内外众多领先的厂商,很大比例的高效能计算都是由领先的英特尔处理器提供源动力。TOP500全球高效能计算排行榜是全球最权威的高效能计算应用情况统计表,根据其2008年6月18日新鲜出炉的榜单数据显示,基于英特尔处理器的上榜高效能计算系统共有375台,占全球前500名单总数的75.00%,相比前一期榜单中70.08%的份额有进一步提升。而此次中国地区上榜的12台高效能计算系统中的11台系统均基于英特尔处理器构建。
处理器前期上榜系统数量本期上榜系统数量系统数量所占比例Rmax合计(每秒万亿次浮点运算)Rpeak合计(每秒万亿次浮点运算)处理器数量合计英特尔35437575.00%59185849714666950114IBM Power616813.60%386321950344061041652AMD795511.00%18673982646183417175其他620.40%50815592936134总计500500100.00%11700015.8717454547.72415075
2008年6月TOP500全球高效能计算排行榜处理器架构分析
处理器:高效能计算的核心动力
英特尔能得到高效能计算客户的广泛认同,关键在于英特尔有成熟完备的高效能计算解决方案,并能不断满足高效能计算客户对高效能计算系统提出的越来越高的需求。
英特尔架构处理器为有强大性能表现的高效能计算节点服务器提供源动力,能针对高效能计算的需求,高效率的进行大规模并行计算,同时具有节能环保的特点:
多核技术推动性能飞跃
继2006年英特尔首发四核处理器后,其强大的性能吸引了越来越多客户的青睐。此次TOP500榜单显示,基于四核处理器的高效能计算系统已经占据市场主流,全部500台系统中基于四核处理器的达到283台。其中,共有257台高效能计算系统采用了四核英特尔®至强®处理器(包括至强®5300系列处理器、双至强®5400系列处理器以及至强®7300系列处理器),占全部四核处理器系统总数的90.81%,占全部系统的51.40%。
值得注意的是,四核英特尔®至强®处理器在高效能计算系统中的广泛应用大大推动了TOP500上榜系统整体性能的提高。举例来看,本次榜单中排名最后的系统的性能在仅仅六个月前的榜单中可名列第200名。
领先技术全面提升系统能效
能耗与散热是IT数据中心一直试图妥善解决的难题,最新一期TOP500榜单中首次引入能效指标也足以说明能耗问题对于高效能系统构建的重要程度。
英特尔架构处理器为满足高效能计算的节能环保需求,同时为客户提供多种热设计功耗,以满足高效能计算所需的高密度部署。英特尔领先的45纳米处理器制程技术可以大大提高单个处理器的能效,此次TOP500榜单上,基于45纳米制程的英特尔®至强®5400系列处理器取得x86架构能效表现前三名,其它基于该处理器构建的系统在能效问题上也有着不俗的表现。
在进行集群能效管理方面,英特尔新一代至强处理器都将支持按需切换技术(Demand Based Switching ,DBS),该技术可以根据系统任务的负荷程度,动态调整处理器主频,在需要高效率处理数据时让CPU全速工作,而在处理简单任务时,则选择降低工作频率,有效地减少了处理器空闲时的功耗。根据Intel公布的测试数据,采用DBS技术可以平均节约能耗28%以上。功耗的降低大大减轻了IT数据中心的能耗与散热压力。
软件调优:高效能计算的制胜法宝
英特尔®软件产品是一整套帮助应用开发及使用人员在X86及安腾体系架构上最大程度提升性能的软件工具。这些工具与目前市场主流的高效能计算软硬件运行环境兼容,使用人员很容易将这些工具与他们现有的软件工具配合使用。英特尔高效能软件产品由一组完整的工具产品组成,包括高效能编译器,VTune™ 可视化性能分析器,高性能函数库,多线程工具和应用于高效能计算的集群工具及工具包等等。这些软件产品能帮助用户通过调优中间件和应用软件,最大限度发挥系统的性能。目前,英特尔®软件产品已被越来越多地成功使用在全球很多知名的软件公司、高效能计算中心及实验室内,并且发挥着越来越重要的作用。
最新TOP500榜单中排名第一的胜利油田,采用的是2.33GHz英特尔®至强®双核处理器,具有960个节点,共4096颗处理器,其实测LINPACK峰值高达18.60万亿次浮点运算。这一成绩的取得不仅依靠强大的硬件支持,软件调优更是功不可没。该系统在调优过程中采用了英特尔公司提供的两个软件: Intel Compilers(编译器)和Intel VTune Analyzers。该系统在建立伊始,其16个集群节点的效能只有66%,仅仅达到了0.39万亿次/每秒的水平。技术人员在采用Intel VTune Analyzers调优工具的分析后,发现系统在交换机方面存在瓶颈,通过与网络厂商技术人员分析行和调整,系统的性能提升到9.28万亿次/每秒(1000个节点)。此后,该系统采用MPI+OpenMP的混合应用架构,进一步将性能提升至12.2万亿次/每秒的。最后又通过移除掉缓慢交换节点,以及反复平衡每一个节点性能后,才最终达到了目前的18.6万亿次/每秒的水平。
从需求出发,设计完美高效能计算系统
用户在选择高效能集群时,通常首先关注的是性能指标。而在每台高效能集群系统最初设计的建议多是综合了目前应用实测结果,以及专家的经验给出的。通常情况下,由于实际测试需要的设备和工作量太大,所以用户大多是从已有平台的测试结果定性的推测未来平台的性能。如此进行高效能计算系统的设计会与实际情况有一定的偏差。
为了更好的分析现有系统及预测未来应用所需硬件平台的实际性能,英特尔提供了全面的工具以实现对应用软件的计算、通信和数据存储等多方面进行精细化的特征分析,并分析高效能集群系统的硬件系统特征,再将数据组合起来,以建立性能模型,再通过性能模型模拟并预测应用软件在未来硬件平台上的实际性能。采用这些分析工具,可以大大提高用户设计未来高效能集群系统的准确度。
与产业精诚合作,助力中国高效能计算发展
英特尔拥抱开放标准,与业界众多合作伙伴为用户提供整体的解决方案,并分享成功实践经验。
高效能计算系统:在英特尔的支持下,国内外领先的高效能计算厂商提供了众多基于工业标准的至强®和安腾®处理器的高效能计算系统。通过使用这些开放体系架构的处理器,高效能计算客户将能以更合理的价格获得拥有领先性能表现的系统,而不受制于专有系统的封闭性。
高效能计算标准:英特尔与业界合作伙伴一道共同推动行业标准的建立,为高效能计算的发展打造开放的平台。例如,英特尔与业界合作伙伴共同推动高速网络的标准InfiniBand不断走向成熟,TOP500上榜的高效能计算系统中有超过20%选用了基于该标准的高速网络。
英特尔成立40周年,以及进入中国23年以来,一直不断致力于创新,与国内外高效能计算厂商一道,为中国高效能用户提供领先的高效能计算解决方案和行业实践经验,帮助其提升核心竞争力,从而在未来的发展中走在世界前列。