何万青:至强融核让英特尔离百亿亿次更近一步

一年一度的英特尔高性能计算研讨会将于7月5日至7月8日在南京举行。自2007年首届至今,英特尔(中国)已经成功举办了五届英特尔高性能计算研讨。该研讨会不仅已经成为英特尔的一项传统会议,而且在中国能源领域成为高性能计算需求和发展的风向标。

7月4日,大会前夕,英特尔数据中心事业部亚太和中国区高性能计算/工作站方案架构师何万青博士、英特尔能源及高吞吐计算团队高级主管工程师菲利浦•蒂埃里(Philippe Thierry)博士在北京接受了DOSERV记者的采访,介绍了本届大会的特点以及英特尔在高性能计算上的最新进展。

何万青博士透露,2012英特尔高性能计算研讨会除了继续探讨在石油勘探、生命科学等领域的高性能算法外,大会新增了云计算、能耗、机房等方面议题,使得高性能计算更加贴近当前云计算和新一代数据中心等热点。

英特尔数据中心事业部亚太和中国区高性能计算/工作站方案架构师何万青博士

借着对新公布的全球高性能计算TOP500榜单的分析,何万青博士介绍了英特尔在高性能计算领域的投资,以及英特尔中国团队在高性能领域的工作。

TOP500:英特尔优势继续扩大

根据最新公布的全球高性能计算机500强排行榜,英特尔继续遥遥领先。在本届榜单中,有74%的上榜系统采用英特尔架构,同时新晋榜单的系统中有78%是基于英特尔架构。这意味着英特尔的份额有望进一步扩大。

各架构在TOP500中的应用情况

与此同时,即使是刚刚发布的英特尔至强E5处理器,已经有45套基于至强E5的系统进入TOP500,这其中包括了3套拥有每秒千万亿浮点计算能力的系统。位于莱布尼茨超级计算中心(LRZ)的“SuperMUC”是其中最大的高性能计算机,具备每秒2900万亿次浮点计算能力(2.9 Petaflops),是欧洲计算能力最强的高性能计算机,也是基于x86架构的计算能力最强劲的高性能计算机。

何万青表示,至强E5相比至强5600,性能提升高达80%,而在某些特定状态下,能够实现比前代产品节能达50%。这对于日渐追求能耗产出比的高性能计算用户具有很强的吸引力。而伴随着至强E5-2600和E5-4600的相继到位,下半年会有更多的基于至强E5的系统上榜。

至强融核:百亿亿次更近一步

即将于2012年年底问世的英特尔众核(MIC)处理器引起了业内的强烈关注。在前不久举行的国际超级计算大会上,英特尔公司宣布未来所有基于英特尔集成众核架构(英特尔MIC 架构)的产品将采用全新品牌——英特尔至强融核。

英特尔一直将至强融核誉为通往百亿亿次超级计算机的“捷径”,从目前英特尔公布的技术细节以及英特尔做的样机来看应该能担此重任。

英特尔能源及高吞吐计算团队高级主管工程师菲利浦?蒂埃里博士

英特尔能源及高吞吐计算团队高级主管工程师菲利浦?蒂埃里博士介绍,英特尔至强融核协处理器将采用22 纳米3-D三栅极晶体管制程技术,可在 PCI-e 插卡形态下集成超过50颗内核和支持最低8GB容量的GDDR5 内存。此外,它还具备支持512b SIMD 指令的特点,可在单个指令控制下同时处理多个数据元素,从而能显著提升性能。

在去年使用DGEMM进行的协处理器现场演示中,英特尔进行了使用单颗“Knights Corner”协处理器提供超过1TeraFLOPs(每秒1万亿次浮点计算)双精度实际性能的展示。而在2012年国际超级计算大会上,英特尔使用行业基准测试工具Linpack (Rmax)展示了同样超过1 TeraFLOPs 的性能。

英特尔至强融核处理器

英特尔还宣布首个基于英特尔至强融核协处理器的集群已经投入使用,并在本届高性能计算机500强榜单上位列第150位,其具备了每秒118万亿次浮点计算的性能。

在国内,英特尔已经将“Knights Corner”提供给一些用户测试和试用。同时,浪潮、曙光、超云等系统厂商已经和英特尔至强融核展开前期的合作。

为实现到2018年达到百亿亿级计算目标的承诺,英特尔还在多个领域进行了大量投资。英特尔最近就收购了Qlogic的Infiniband业务和Cray的互连技术,以进一步开拓创新,消除在未来提供可扩展的百亿亿次级计算平台所面临的障碍。

HPC:生态链更加成熟

除了提供更高性能、更低功耗的处理器以及固态硬盘、高速互联技术外,英特尔还提供了适用于多种操作系统的软件开发工具套件——Parallel Studio XE和Cluster Studio XE。两款产品都融合了英特尔C/C++和Fortran编译器,支持最新的至强E5处理器、性能与并行库,以及正确性分析器和性能档案器,以便最大程度实现应用程序性能、代码质量和可靠性。

菲利浦?蒂埃里专门介绍了英特尔Cluster Studio XE,它为英特尔架构(IA)集群上的分布式并行计算设定了新标准。这种高级工具套件具有很高的灵活性,在IA-32和英特尔64位架构的基础上,使基于MPI的应用程序性能适用于高度并行、共享内存的集群系统。英特尔Cluster Studio XE可轻松编码、调试并优化基于MPI的集群应用程序,以便获得高至PFLOP级的性能。

为了支持中国高性能计算的发展,英特尔还和浪潮建立了联合实验室,加大在生命科学、石油等领域的研发。此外,英特尔还积极推进英特尔真实应用负载计划和“Cluster Ready”计划。

其中,“Cluster Ready”计划是对许多硬件厂商和软件厂商的产品进行兼容性认证,让用户在搭建集群方面不用在选型方面费心思。英特尔“Cluster Ready”可以帮助用户在采购和使用新平台时更加简单。用户只要选购经过英特尔 Cluster Ready认证的应用软件和集群系统,就可以确保硬件平台和软件应用之间的互操作性,获得性能提升和稳定可靠的平台。

何万青博士透露,目前英特尔和浪潮、联想在“Cluster Ready”计划方面合作很深,联想已经有20多套系统通过了验证。而在真实应用负载计划中,英特尔目前主攻16个节点的至强E5集群,已经在一些科研院校进行实际测试。

总体而言,在英特尔的大力支持和推动下,中国高性能计算的生态链正在日臻完善。而一年一度的英特尔高性能计算研讨会,又将是国内高性能计算研究和使用者的一场盛会。