微异构倍受认可 至强融核魅力何在?
DOIT原创 崔昊 发表于:13年06月25日 23:55 [原创] DOIT.com.cn
微异构倍受认可 至强融核魅力何在?
为何一年过去英特尔至强融核协处理器系统能够取得如此大的进步,能在竞争对手的加速器架构跌出TOP500排行榜的情形下加速冲刺?
首先,英特尔至强融核为高性能计算系统带来了巨大的性能提升,早在2011年英特尔就在DGEMM 进行的协处理器现场演示中,进行了使用单颗“ Knights Corner”协处理器提供超过 1 TeraFLOPs(每秒 1 万亿次浮点计算)双精度实际性能的展示;在2012年年底进行的正式发布中,英特尔至强融核主要产品5110P能够提供1011 Gigaflops(即每秒1万亿次浮点计算)的双精度浮点计算性能。
Stampede系统是英特尔至强融核高性能最具代表性的受益者,这一系统在2012年6月仅以1809.9TFlops(Rpeak,以下同)位居第150位,但半年后的TOP500中就以3959.0TFlops的性能位列第七,更令人吃惊的是,这一系统目前已凭惊人的8520.1TFlops位列最新TOP500第六位。
其次,从Stampede的性能提升中我们不难发现,德州高级计算中心(TACC)在一年的时间里,不断飞跃式的性能提升已经明显验证了高性能计算系统性能提升的最佳“法则”——扩展更简单、性能提升更快、效率提升显著——这对传统的异构-混合架构而言是很难实现的。
这说明,TACC的工程师们在扩展硬件规模的同时,让应用程序“跑满”了系统的性能,让程序代码快速的适应了大规模动态扩展的系统(甚至是在一个混合架构中),这一(混合架构)系统的可编程性远远超过它的“同类”们:Stampede是(第一款)使用英特尔至强融核协处理器的TOP500榜单角逐者,采用英特尔的“微异构架构”(Neo-heterogeneous architecture)。
“微异构架构”(Neo-heterogeneous architecture)的架构以英特尔至强处理器和英特尔至强融核处理器组成,是一种具有多种类型、可提供计算力的硬件架构,但却由通用编程模型予以支持,以简化开发和优化过程。这一优势是传统异构架构(使用CPU与GPU加速器的组合)所无法实现的。
在这一架构中,用户能够充分利用在英特尔架构上使用的常见编程模式、技术和开发者工具——用英特尔并行编程传播总监James Reinders的话说:“如果你想用相同的语言(比如Fortran)、相同的并行编程模型、熟悉的工具满足高度并行的需要,至强和至强融核是最好的选择。”
尤其是在“并行时代”,英特尔“微异构架构”的优势更为明显。一方面,至强融核作为高度并行设备,在并行编程中能够获得强大的性能表现,而至强处理器也能够获益;另一方面,由于英特尔努力尝试着解决了硬件特定编码的问题,可以用Fortran、C、C++,编程不受限制,用户可以在英特尔至强+英特尔至强融核的“微异构架构”中以“同样的语言、并行编程模型和类似的工具来满足高度并行的需求”,英特尔“微异构架构”通过“可复用、简单、单一的编程模式”已经获得了大量用户的认可。