全球最快计算机“天河二号”装有英特尔芯
江南 发表于:13年06月18日 23:49 [来稿] DOIT.com.cn
国际超级计算大会(ISC’13),德国莱比锡,2013 年6月17日,一套采用数万颗英特尔处理器和协处理器构建而成的系统,刚刚在第41届全球高性能计算机500强(TOP500)排行榜中被评为全球最强大的超级计算机。
该系统名为“天河二号”(Milky Way 2), 配备了48,000颗英特尔® 至强融核™ 协处理器和32,000颗英特尔® 至强™ 处理器,峰值性能可达54.9 PFLOPS(每秒54.9千万亿次浮点运算)。与2012年11月发布的上一届TOP500排行榜中排名第一名的系统相比,其性能提升达两倍以上。 这也是自1997年以来第一款登顶TOP500榜单的、完全基于英特尔技术的系统。
英特尔公司同时还宣布扩展英特尔至强融核协处理器产品组合,并透露了第二代英特尔至强融核产品(代号“Knights Landing”)的详细信息。这些全新的产品和技术将继续大幅提升全球超级计算机的能效和性能。
全球高性能计算(HPC)服务器市场的年收入预计将于未来四年增长36%1,从110亿美元增至150亿美元。各个行业和领域对快速计算、模拟和制定更明智决策的需求持续推动着超级计算机的快速发展。 超级计算机现在被用于提高天气预报的准确性、帮助探索更高效的能源、研究疾病的治愈方法、对人类基因组进行测序及大数据分析等工作。
英特尔公司数据中心及互联系统事业部副总裁兼技术计算部门总经理Raj Hazra表示:“英特尔制定了超级计算愿景和产品蓝图,致力于帮助客户不断推陈出新,发现新商机,同时大幅提升竞争力。用户对于更高计算力和更高能效水平的需求永无止境。借助现有的和未来的英特尔至强融核协处理器、英特尔至强处理器、英特尔® TrueScale互连技术及软件,英特尔将能够为客户带来完备的解决方案,全面满足其需求。”
自从6个多月前推出英特尔至强融核协处理器以来,英特尔® 至强™ 处理器和英特尔® 至强融核™ 协处理器已发展成为一个强大的组合,在全球最快的多个超级计算机中得到了广泛采用。英特尔至强融核协处理器基于英特尔® 集成众核(英特尔® MIC)架构,可全面满足客户对于更高性能、更高能效和简单易用技术的需求。
“天河二号”——全球最快的超级计算机
由中国广州国家超级计算中心构建的“天河二号”超级计算机,配备了32,000颗即将发布的、基于Ivy Bridge微架构的12核英特尔® 至强™ 处理器E5-2600 v2, 以及48,000颗英特尔® 至强融核™ 协处理器,系统总功率为17.8兆瓦。在最新的全球高性能计算机 500 强排行榜中,它不仅性能最强,还是能效最高的系统之一。该系统采用“微异构架构”(Neo-heterogeneous architecture), 即具有多种类型、可提供计算力的硬件架构,但却由通用编程模型予以支持,以简化开发和优化过程。这一优势是传统异构架构(使用CPU与GPU加速器的组合)所无法实现的。
该系统的出众性能和能效表现得益于其使用了即将发布的、基于英特尔领先的22nm制程工艺的英特尔® 至强™ 处理器E5-2600 v2产品系列。作为英特尔支持超级计算机用户的“先期供货(early ship)”计划的一部分,这款处理器除被用于“天河二号”外,同时还被用于最新全球高性能计算机500强榜单上来自 Bull* 的另外两套系统,它们分别为在榜单上排名第54位,拥有每秒557万亿次浮点计算性能的系统和在榜单上排名第330位,拥有每秒140万亿次浮点计算性能的系统。这一新款处理器将于下季度正式供应,它可集成多达12个核心、时钟频率最高达2.7GHz,能够为每个处理器插座提供259 GFLOPS(每秒2,590亿次浮点计算)的性能,相比上一代产品提升了56%。
在第41届全球高性能计算机 500 强排行榜中,超过80%(403套系统)的上榜系统采用了英特尔处理器。在该榜单的所有新晋系统中,则有超过98%的系统采用了英特尔处理器。该榜单中还有11套系统配备了英特尔® 至强融核™ 协处理器,其中包括性能级别达每秒千万亿次浮点计算的系统,如峰值性能达54.9 PFLOPS(每秒54.9千万亿次浮点计算)的“天河二号”系统和峰值性能为8.5 PFLOPS(每秒8.5千万亿次浮点计算)的“Stampede”系统。
每半年发布一次的全球高性能计算机500强排行榜由曼海姆大学的Hans Meuer、美国能源部下属的国家能源研究部门超级计算机中心的Erich Strohmaier与Horst Simon、以及田纳西大学的Jack Dongarra共同完成。
全新英特尔至强融核协处理器3000和7000产品家族
英特尔公司还于今天宣布推出五款全新产品,以扩展其现有的英特尔至强融核协处理器产品组合,带来更广泛的性能、内存容量、能效和外形选择。在这些产品中,英特尔至强融核协处理器7100 产品家族经过精心设计和优化,具备最佳性能和最高级别的特性,包括集成了61个时钟速度为1.23GHz的内核、拥有16 GB的内存容量支持(比此前加速器或协处理器支持的内存容量提高一倍)和超过1.2 TFlops的双精度浮点计算性能。英特尔® 至强融核™ 协处理器3100产品家族被设计用于提供出色的性价比优势。该产品家族集成了57 个时钟速度为 1.1 GHz的内核,可提供1 TFlops的双精度性能。
此外,英特尔还为去年推出的英特尔至强融核协处理器5100产品家族增添了一个新成员——英特尔至强融核协处理器5120D,它针对高密度环境进行了优化,能够以小型主板的形态支持插座直连,构成类似刀片的系统。
“Knights Landing”——可兼顾协处理器或处理器的选择
英特尔公司还透露了其第二代英特尔至强融核产品的详细信息,该产品将进一步增强其在超级计算领域的能力。这个代号为“Knights Landing”的下一代英特尔集成众核架构产品将能够作为协处理器或主处理器(CPU)提供,并将采用包含第二代3-D三栅极晶体管技术的英特尔14 纳米制程工艺进行生产。
作为基于PCIe板卡的协处理器时,“Knights Landing”将处理由系统内英特尔至强处理器迁移出的工作负载(Offload Workloads),并为现有协处理器的用户提供升级路径。然而,当它作为主处理器直接安装于主板插座中时,它将发挥出CPU的作用,大幅提升计算密度和每瓦性能,同时肩负起主处理器和专用协处理器的所有职责。当它被用作CPU时,会与现有的加速器相似,能够消除通过PCIe传输数据的编程复杂性。
为了进一步提升处理高性能计算工作负载的性能,英特尔将在所有“Knights Landing”产品中引入可集成在其封装内的内存,以大幅提高其内存带宽。这将改善目前存在的内存带宽瓶颈问题,让用户能够充分利用所有可用的计算力。