DOSERV服务器在线原创报道: 天河二号现在有了一个好听的名字:Milk Way-2,虽然此前Tianhe-2这样的音译名称,并未阻碍它迅速成为全球高性能计算界最耀眼的明星。
这个如今占据全球TOP500的巨型设备有着3120000个计算核心,采用的是英特尔即将于今年推出的采用IvyBridge架构的至强E5-2692 12核心处理器,以及定制化的48000颗英特尔至强融核31S1P处理核心,1024TB内存,虽然耗电达到17.8兆瓦,但其峰值计算性能达到了令人瞠目结舌的54.9PFLOPS。
需要指出的是,国防科大继天河1号、天河1A之后,在天河2号上形成了根据规模的“国产化”架构,除英特尔至强及至强融核提供计算能力外,天河2号使用的是国产的Kylin Linux——麒麟操作系统,主要的研发、测试和生产全部由来自国防科技大学及国内的计算机科学家完成,内部连接使用自主研发的TH Express-2,前端处理器(front-end processors)则使用来自国内研发的飞腾中央处理器。
可以说,天河2号已经达到了目前国内高性能计算行业所能达到的“核心系统国产化率”的顶点,而作为一套登顶TOP500排行榜的高性能计算机,天河2号所带来的突破绝不低于当年天河1号在长沙所带来的震撼性影响。
不过,天河2号所带来的对HPC领域的影响绝不仅仅是“中国人再次站在了第一位”上这么简单,作为一款使用英特尔至强和至强融核的微异架构的HPC系统,天河2号是“纯至强家族HPC系统”首次(甚至也是1997年以来完全基于英特尔技术系统第一次登顶)登上TOP500的榜首“,这对于混合架构HPC以及英特尔来说,都是一次不小的成功和里程碑。
但在这样一套系统成为NO.1之后,整个TOP500排行榜出现的一些细微变化也让我们对于HPC市场的发展产生了一些猜测,并引发了业界对于HPC市场发展方向、混合架构系统的出路、英特尔HPC及融核战略的走向等一系列话题的讨论。
1、 TOP500榜单中混合系统(采用加速器、协处理器技术accelerator/co-processor)的数量出现显著下降,从2012年11月榜单的62套下滑到了54套,这其中虽然仍然包括11套至强融核及39套NVIDIA混合架构系统,但总体来说,超过10%的下滑数量,对混合架构在TOP500排行榜上曾经爆发式的增长,产生了极大的影响。
混合架构一直被认为是冲击TOP500的利器,甚至于最近几年的榜单,基本上第一名都是混合系统,这其中的赢家当然是NVIDIA,正是这家公司引发了这一潮流。但同样显著的是混合系统令人堪忧的效率问题,而这也是被许多公司及用户所诟病的最主要的一点。
对于这样的趋势,英特尔产品经理张振宇的看法是,长期以来,确实存在以混合架构系统”冲榜“这样的情况出现,但效率低下的混合架构系统带来了效率、编程等一系列的问题,对于大多数用户来说,他们更需要的是真实的计算力,而不是理论峰值。因此,混合架构的下滑是必然的趋势,但英特尔通过至强与至强融核的微异构架构正在努力解决这个问题。
2、 蓝色基因系统(BlueGene)仍然颇为坚挺的在TOP10中占据4个席位,这不仅说明了蓝色基因系统强大的实力,也说明Power BQC这样的专有处理架构仍然具有强大的客户吸引力,尤其是当蓝色基因系统具有普遍高于TOP500平均值的计算效率时,这一问题就更为突出。
对此,张振宇认为,在用户端,专有、封闭的系统可以做到针对应用、环境的最优化,在这一点上,蓝色基因是尤为出色的代表,其针对特性应用程序和计算模型的效率非常之高,用户因此十分认可这样的系统所带来的强大计算力。
但这并不意味着不存在问题,蓝色基因系统相对x86为主的TOP500榜单其它系统来说,专有、封闭的架构使得其建设和维护费用高昂,尤其是服务费用长期居高不下,虽然带来了极致的性能和效率,带用户的负担普遍会高于x86平台的HPC系统。
3、 至强融核的接受程度还有待提升,相比2012年11月榜单的7套系统,这一次虽然有11套至强融核(微异构架构)上榜,但相比几年前混合架构刚刚出现时的火爆场景差距还很大,一方面,显然有混合架构在TOP500排行榜上下滑,以及HPC用户对混合架构的效率问题更为关注等原因的影响;另一方面,英特尔所提供的至强融核产品家族的可选择性仍然偏少,也同样是影响因素。
因此,英特尔此次同步TOP500榜单宣布推出了至强融核7100和3100产品线,包括共计四款不同形态的产品,前者集成61个1.23GHz核心,16GB内存容量,提供1.2TFlops的双精度浮点计算性能;后者57个1.1GHz的内容,提供1TFlops的性能,并提供一个面向高性能工作站的带风扇版本。
此外,还有一个面向刀片环境的嵌入式至强融核5120D,专门面向高密度环境优化,”只面向OEM合作伙伴提供“,采用嵌入式子卡的方式支持插座直连。
4、 连接对效率的影响仍然巨大,很显然,越来越多的系统开始采用InfiniBand来提升效率,以太网被采用的数量正在逐步下降,尤其是在高效率的系统中,除了专有连接之外,几乎清一色都是InfiniBand的系统。与混合架构数量下滑一样,据信这样的情况,都产生于对HPC系统计算效率提升的需求。
这就引发了一个问题:把处理器或是协处理器的集成度做的更高,甚至朝着SoC的方向发展,是否是个更进一步迈向百亿亿次计算的发展趋势?
英特尔下一代的至强融核架构正在做这样的改变,据英特尔披露的代号为”Knights Landing“的第二代至强融核,将提供两种模式:主处理器及协处理器模式,分别采用与至强处理器一样的插座及PCIe插座接口,14纳米工艺生产。
其最重要的改变是”Knights Landing“中将引入可集成在其封装内的内存,大幅度提高其内存带宽——显然将改善内存带宽瓶颈问题,而这一产品集成内存的改变或许将是至强处理器集成更多功能:IO、交换等的开端,也是x86处理器开始朝着SoC方向发展的开端。
张振宇认为,提高集成度是朝着百亿亿次发展的最重要的产品形态的改变,要想在高效率、低功耗、高性能的整体层面解决未来百亿亿次所遇到的计算核心的挑战,更高的集成度显然是必须的选择,而”Knights Landing“这样的集成,或许只是x86提高集成度,朝着SoC方向发展的一小步而已。
最后,值得说的是,随着高性能计算在各行各业应用的范围不断加大,整个市场未来四年将增长36%,市场空间将从2012年的约110亿美元增至150亿美元。现在,超级计算机不仅被用在类似人类基因组测序、欧洲大型强子对撞机、国防科工等高端科研领域,在天气预报、资源探索、疾病研究等领域也发挥着极大的作用,直接或间接的改变着我们所生活的环境。
虽然几年前,个人高性能计算机的浪潮被证明仍然有待时日,但我们应当相信这一愿景会在我们于2018年前后最终迈向百亿亿次计算的过程中得到实现。
而对于关心英特尔产品发展走向的人们来说,2007年前后英特尔所展示的的80核心铜互连处理器技术及48内核单芯片云计算机所引领的x86的发展路线图仍然清晰可见:高效的内部互联、更高的集成度、更高的密度以及x86可见的SoC化趋势,都将在未来几年不断深化。