英特尔公布下一代高性能计算平台的细节

11月15日,美国华盛顿州西雅图SC11大会上,英特尔公司公布了专为高性能计算(HPC)设计的、基于英特尔至强处理器和英特尔集成众核(Intel MIC)架构的下一代平台的细节,以及全新的、旨在引领行业于2018年实现百亿亿级(Exascale)性能的研发投资计划。

在SC11 大会上所做的简短发言中,英特尔数据中心及互联系统事业部技术计算业务总经理Rajeeb Hazra介绍了英特尔 至强 处理器E5系列,它是全球首款支持在芯片内集成PCI-E 3.0规格 的服务器处理器。PCI-E 3.0 预计 可提供双倍于PCI-E 2.0规格 的互连带宽,从而能推动拥有更低功耗、更高密度的服务器的实现。新的网络控制器将充分利用PCI-E 3.0规格的优势,随着高性能计算系统内部节点的增多,来实现更高效率的性能扩展与数据传输。

据初期的性能基准测试显示:与上一代英特尔至强处理器5600系列相比,英特尔至强处理器E5系列的初始每秒浮点运算性能(FLOPS,Floating Point Operations Per Second,由Linpack 测出)是前者的2.1倍,而它运行实际高性能计算工作负载时的性能则比前者高出70%。

“用户们对于英特尔至强E5处理器的接受度超出了我们的预期,而且它跻身TOP500排行榜的速度,也是英特尔历史上所有处理器产品中最快的一个,”Rajeeb Hazra表示:“收集、分析和分享海量信息对今天的科研活动来说至关重要,这需要更上一层楼的处理器性能表现以及专为此目标精心设计的技术。”

英特尔至强处理器E5本次亮相TOP500排行榜,正值全球首款微处理器(英特尔4004处理器)问世40周年及英特尔“至强”品牌发布10周年。据英特尔估算,自至强处理器于2001年发布至今,其性能已经提升了130多倍。

在向高性能计算中心发货的两个月内,英特尔至强处理器E5系列已被用在了TOP500排行榜上的十套系统中,这些系统一共配备和运行了超过20,000颗该款处理器,可累计输出超过每秒3.4千万亿次浮点运算(PFLOPS)的峰值性能。

正如之前英特尔所公布的,即将发布的英特尔至强处理器E5系列还将用于其他数套未来将部署的高性能计算机,其中包括了性能可达10 PFLOPS,归属德克萨斯州高级计算中心的“Stampede”系统;性能为1.6 PFLOPS,归属美国国家大气研究中心的“Yellowstone”系统;性能为1.6 PFLOPS,将由法国国家大型计算中心(GENCI)使用的“Curie”系统;性能为1.3 PFLOPS,用于国际聚变能源研究中心(IFERC)的高性能计算系统,以及性能超过1 PFLOPS的美国国家航空航天局(NASA)的“Pleiades”系统扩展。

英特尔公司从今年9月起就开始向一小部分云计算和高性能计算用户发运英特尔至强处理器E5系列,并计划于2012年上半年全面发售这款新品。英特尔公司目前已经赢得了超过400款针对该处理器的系统设计,其数量接近至强5500和至强5600处理器发布时的两倍,而业界对其首批产品的需求量,也比至强5500和至强5600处理器多了20倍。

在SC11大会期间,英特尔还提供了其阵容更为强大的服务器主板和机箱产品线的详细信息,其中包括针对高性能计算进行了特别优化的产品,它们将为英特尔至强处理器E5系列的发布提供支持。

款提供TFLOPS性能的英特尔集成众核协处理器亮相

在SC11大会上,英特尔公司还重申了其为高度并行化应用打造最高效及易于编程的平台的承诺。在大会展位上,英特尔演示了英特尔集成众核架构为天气建模、射线扫描、蛋白质折叠和先进材料模拟等应用带来的优势。

基于英特尔集成众核架构的“Knights Corner”协处理器产品的首场现场展示就显示出了英特尔架构有提供超过1 TFLOPS的双精度浮点性能(由DGEMM 测出)的能力。这还是用单颗处理芯片冲击如此高性能水平的首次展示。

Rajeeb Hazra表示:“英特尔公司首次展示性能达到TFLOPS的高性能计算系统还是在1997年时,那是配备了9,680颗英特尔奔腾Pro处理器,归属于美国桑迪亚国家实验室的“ASCI RED”系统。而今,同样的性能仅在单颗基于英特尔 集成众核架构的芯片上即可实现,这堪称一个里程碑,它也将被镌刻在高性能计算的发展史上。”

“Knights Corner”是首款可投入商用的英特尔 集成众核架构产品,将使用英特尔最新的3-D三栅极22纳米晶体管制程工艺生产,并将集成超过50个内核。在未来发布后,这款英特尔 集成众核产品不但能为高度并行工作负载的处理任务提供源自其特殊架构设计的高性能,还能与现有x86编程模型及编程工具保持兼容。

Rajeeb Hazra指出:“Knights Corner”协处理器的独特之处就在于:它不像传统的加速器,而更像是一个能被访问及被编程的、功能全面的高性能计算节点,在应用程序看来,它就如同一个运行着自有的、基于Linux的操作系统(与主操作系统无关)的计算机。

英特尔集成众核架构的优势之一,就是能够运行现有的应用程序,而无需将其代码转移到新的编程环境中去。这一点将允许科学家们在现有的基于x86的应用程序上同时利用中央处理器(CPU)和协处理器的性能,而无需用其他专有语言重新编写这些代码,从而显著节省了时间、成本和资源。

英特尔实验室增加对百亿亿级计算实验室的投资

英特尔曾在汉堡举办的2011国际超级计算会议上(International Supercomputing Conference 2011)宣布要在2018年实现百亿亿级(Exascale)性能(这一性能相当于现有顶级高性能计算系统性能的百倍以上)且功耗仅比现有顶级高性能计算系统增加一倍的目标。实现它的基础是要同高性能计算社区紧密合作。今天,Rajeeb Hazra 就公布了几项新计划以帮助实现这一目标。

英特尔和巴塞罗那超级计算中心(BSC)签订了一份长期协议,旨在与该中心合作,在巴塞罗那建立百亿亿级实验室。该实验室将是继法国巴黎、德国尤利西(Juelich)和比利时鲁汶(Lueven)的实验室之后,英特尔在欧洲成立的第四个百亿亿级研发实验室,而它将专注于编程中的可扩展性问题以及百亿亿级高性能计算系统的运行时系统。

此外,英国科学和技术设施委员会(STFC)也与英特尔签署了一份备忘录,旨在共同开发和测试未来高性能计算机所需的技术。根据这份协议,STFC位于英格兰的达斯伯里实验室(Daresbury Laboratory)的计算科学家们将与英特尔公司携手使用先进的软件应用测试和评估英特尔现有的以及未来的硬件产品,以确保科学家们能够为使用英特尔未来的高性能计算系统做好准备。

全球高性能计算机500强

SC11大会上公布的第38届全球高性能计算机500强排行榜,显示出英特尔 至强 处理器继续在全球领先的科学家和科学机构使用的高性能计算机中占据主导地位。所有新晋上榜系统中,基于英特尔处理器的系统数量所占比例为近85%,英特尔 至强 处理器5600系列则是上榜系统使用率排名第一的处理器,足足有223套系统是基于它构建。英特尔 至强 处理器E5系列则是首次在榜单中亮相,共有10套上榜系统采用它,并以每个处理器插槽输出152 GFLOPS(每秒十亿次浮点运算)的性能和91%的效率刷新了排行榜的相关记录。在TOP500榜单上排名前十的系统中,有5套采用了英特尔处理器,而在所有上榜系统中,英特尔处理器也拥有近77%的采用率。