挑战计算极限 至强融核将定义未来

美国犹他州盐湖城,2012年11月12日——英特尔公司今天推出了多年研究和协作的结晶——英特尔至强融核协处理器(Xeon Phi),旨在为制造、生命科学、能源和其它领域的创新性突破提供无与伦比的性能。昨日,英特尔也在北京举办了至强融核协处理器发布活动。

挑战计算极限 至强融核或将定义未来

2012年11月13日于北京,英特尔正式发布了全新的至强融核(Xeon Phi)协处理器。此次发布的至强融核协处理器包括3100系列和5110P两款。在北京的发布会上,来自英特尔中国有限公司服务器平台产品经理张振宇先生,和大家分享了这两款至强融核协处理器的规格细节。

挑战计算极限 至强融核或将定义未来

英特尔中国有限公司服务器平台产品经理 张振宇

张振宇表示,从2011到2016年,高性能计算市场的年复合增长率将达到20%,在能源、生命科学、影音娱乐、国家安全等方面,对计算的需求都日渐增加。HPC不仅是重要的研究手段,同时也是国家体现出整体实力的重要标准。而英特尔新产品的发布,也是出于希望客户在购买解决方案的同时,降低成本、提高效率,同时为未来成长保留扩展空间的目的。

挑战计算极限 至强融核或将定义未来

HPC推动数据中心快速成长

至强E5荣登TOP500 至强融核震撼现身

目前至强E5已经成为服务器市场上应用最广泛的处理器。而至强E5和融核的搭配,可以应用于更多行业中复杂的并行计算应用。这款开发历时8年的协处理器产品是英特尔一个巨大的创新,同时也标志着英特尔和基数计算新时代的到来。至强融核延伸了英特尔至强品牌,支持高度并行化应用。

挑战计算极限 至强融核或将定义未来

英特尔众核架构发展历程概览

至强融核可以用于为英特尔至强进行优化的软件环境之中,在应用移植方面,英特尔至强融核和英特尔至强使用相同的编程语言、指令、库和工具,与传统的加速器不同,至强融核在硬件特定编码、异构TCO方面更有优势,为软件开发商和用户提供应用代码的共享,减少人力物力成本。

英特尔至强融核协处理器基于英特尔集成众核(英特尔MIC)架构,可作为现有英特尔至强处理器E5-2600/4600产品家族的补充,为高度并行化的应用提供无与伦比的性能。

此次推出的至强融核协处理器3100系列和5110p两大家族,基于其最先进的22纳米3-D三栅极晶体管制程工艺生产。

挑战计算极限 至强融核或将定义未来

综合基准测试摘要(图片来自Intel)

英特尔至强融核3100产品家族能够提供超过1000 Gigaflops(即每秒1万亿次浮点计算)的双精度浮点计算性能,并支持容量最高达6GB、带宽最高达240GB/秒的内存,以及内存错误校正码(ECC)等一系列可靠性特性。该产品家族工作时的热设计功耗(TDP)范围在300瓦以内。至强融核3100系列产品,包含3100A和3100T(前者内置风扇主动式散热,后者使用系统风扇被动式散热)。

挑战计算极限 至强融核或将定义未来

至强融核3100系列规格

至强融核协处理器5110P则能以更低的功耗提供额外的性能。该芯片配置60个内核,主频速度为1.05GHz。它能够实现1011 Gigaflops(即每秒1.01万亿次浮点计算)的双精度浮点计算性能。它可支持容量和带宽分别高达8GB和320GB/秒的GDDR5内存,热设计功耗(TDP)为225瓦。这种芯片类似图形卡,能够插入到一个PCI-Express 2.0插槽中,并借助系统风扇进行散热冷却(被动式散热,本身不含风扇)。

挑战计算极限 至强融核或将定义未来

至强融核5110P规格

至强融核能够满足运行计算密集型工作负载(如生命科学应用和金融模拟)的客户需求,而5110P则可用于处理诸如数字内容创建和能源研究等内存密集型工作负载。值得一提的是,至强融核5110P已经交付给一些早期用户,并出现在了最新发布的第40届全球高性能计算机500强(TOP500)排行榜的上榜系统中。

挑战计算极限 至强融核或将定义未来

至强融核3100系列和5110P

为了让诸如德克萨斯高级计算中心(TACC)等客户早日使用全新的英特尔至强融核协处理器技术,英特尔还提供了两款定制化的产品:英特尔至强融核协处理器SE10X和英特尔至强融核SE10P。两者均可在热设计功耗为300瓦的情况下提供1073 GFlops的双精度浮点计算性能,其余规格则与英特尔至强融核协处理器5110P相似。关于TACC采用至强融核的更多信息,我们会在下一页进行详细介绍。

挑战计算极限 至强融核将定义未来[图]

至强融核晶圆

英特尔至强融核协处理器5110P已于今天开始出货,并将于2013年1月28日以2649美元的建议销售价格正式面市。英特尔至强融核协处理器3100产品家族将于 2013年上半年面市,其建议销售价格将在2000美元以下。

英特尔还提供了两款定制化的产品:英特尔至强融核协处理器SE10X 和英特尔至强融核SE10P。两者均可在热设计功耗为300瓦的情况下提供1073 GFlops的双精度浮点计算性能,其余规格则与英特尔至强融核协处理器5110P相似。这些芯片专门用于德克萨斯高级计算中心(Texas Advanced Computing Center,简称TACC)的Stampede超级计算机,并不会商业性上市销售。

挑战计算极限 至强融核将定义未来[图]

Stampede超级计算机

Stampede超级计算机中至强融核,是通过在PCIe riser卡中进行安装并放入到戴尔PowerEdge C8220X“Zeus”计算节点中,每个节点包括2个至强E5-2680处理器和32GB系统内存,如下同所示:

挑战计算极限 至强融核或将定义未来

PowerEdge C8220X “Zeus”计算节点

后面的mezzanine card是为InfiniBand而特定设计的。双LGA2011插槽上面由被动式散热片所覆盖,并且每个插槽对应4个DIMM。在右侧,可以看到一个2.5英寸的存储设备。Stampede使用的是传统硬盘,并未设立Hadoop集群,其专注的是高超的计算性能。

挑战计算极限 至强融核或将定义未来

节点中的蓝色光芒,意味着至强融核被顺利安装并正常工作

挑战计算极限 至强融核将定义未来[图]

Stampede数据存储

Stampede各个节点都采用了2.5英寸硬盘,因此在容量上并不能满足如此规模的超级计算机对数据的存储需求。为此,专有的存储节点也就随之而生。

挑战计算极限 至强融核将定义未来[图]

支持热插拔的驱动器仓

接下来,我们继续看看至强融核协处理器。至强融核协处理器能够充分利用为英特尔架构提供的人们熟知的编程语言、并行模式、技术和开发人员工具,这有助于确保软件公司和企业的IT部门加大对并行代码的利用,且无需为与加速器相关的专有的、针对硬件的特定编程模式重新培训其开发人员。

挑战计算极限 至强融核将定义未来[图]

至强融核协处理器侧面

挑战计算极限 至强融核将定义未来[图]

至强融核协处理器插槽部分

英特尔正在提供包括今天发布的英特尔 Parallel Studio XE和英特尔 Cluster Studio XE在内的软件工具,来帮助科学家和工程师们优化其代码,以便充分利用英特尔 至强融核 协处理器。这些工具能够通过英特尔 至强融核 协处理器和英特尔 至强 处理器E5产品家族共用的编程语言和模型对代码进行优化,从而使应用不但能从英特尔 至强融核 协处理器的数十个内核中获益,亦可从英特尔 至强 处理器E5更为高效的多线程资源利用上获得帮助。

挑战计算极限 至强融核将定义未来[图]

即将安装放入Stampede超级计算机的至强融核协处理器

在最新发布的第40届全球高性能计算机500强(TOP500)排行榜上,不仅有超过75%(379套)的系统采用了英特尔至强处理器,今年11月发布的榜单还新增了7套基于英特尔至强融核协处理器的上榜系统,其中包括:

TACC首次部署的Stampede系统(每秒2.66千万亿次浮点计算,在榜上排名第7)、美国国家航空航天局(NASA)气候模拟中心的 Discover系统(每秒417万亿次浮点计算,排名第52)、英特尔公司的Endeavour系统(每秒379万亿次浮点计算,排名第57)、俄罗斯科学院联合超级计算中心的MVS-10P超级计算机(每秒375万亿次浮点计算,排名第58)、美国国家航空航天局(NASA)Ames研究中心的 Maia系统(每秒212万亿次浮点计算,排名第117)、南乌拉尔国立大学的SUSU系统(每秒146万亿次浮点计算,排名第170)以及田纳西大学国家计算科学研究所的Beacon系统(每秒110万亿次浮点计算,排名第253)。

目前,有包括华硕、宏碁、Cray、戴尔、富士通、惠普、IBM、浪潮、NEC、SGI等超过50家制造商,正在采纳基于英特尔至强融核协处理器的设计解决方案。

英特尔正在借助至强融核协处理器,在x86领域开辟出高度并行的计算市场,由于至强融核可以脱离至强单独运行,而且也支持Linux内核。也许在不远的将来,至强融核将会担当起更多的计算重任,不仅仅在并行计算领域,在整个企业计算中,至强融核或将定义未来计算新格局。