Xeon Phi加速处理器细节:高达61核心

六月份,Intel正式发布了首款基于IMC众核架构、22nm Knights Corner核心的加速处理器“Xeon Phi”,Larrabee借此重生,准备与NVIDIA Tesla、AMD Fusion等等在高性能计算领域一较高下。不过,Intel当时并未公布太多技术细节,规格上语焉不详。

上周,Intel开始向合作伙伴提供B0步进的Xeon Phi芯片样品,我们也得到了比较详细的技术参数。

昨天——

Larrabee独立显卡项目失败后,Intel并未放弃,而是捡起了“Aubrey Isle”核心与合作伙伴继续试验,而搭载此核心的扩展卡代号“Knights Ferry”,2010年三月正式亮相,并称之为“MIC”众核架构。

Aubrey Isle采用的是45nm工艺,32个核心,1MB一级缓存,8MB二级缓存,主频1.2GHz,搭载2GB GDDR5显存,位宽达到惊人的1024-bit,而且是环形总线设计,热设计功耗300W左右。

Knights Ferry扩展卡可以执行x86标准代码,能提供750GFlops的单精度浮点性能,双精度效率41-47%,也就是不到400GFlops。至于这块卡出货了多少,谁也不清楚,反正难得一见,毕竟只是个试验品。

2011年初,准备采用22nm工艺的新核心“Knights Corner”出现了,BIOS、PCB、规格都有很多版本。A0 步进的有48、52、60个核心,1.5-1.9MB一级缓存,24-30MB二级缓存,显存抛弃环形总线,位宽缩减到512-bit(待确认),容量 2、4、8GB GDDR5,等效频率不过2.4-4.5GHz,主频也只有1GHz,因为即便这样热设计功耗也有300W了。

60核心版本曾经演示过1TFlops的单精度浮点性能,但双精度比较惨淡,不足以成气候。

Intel随后准备继续发展B0、C1等新步进,并且计划尽快出货,以登上2013年六月的全球超级计算机五百强名单。

今天——

B0就是现在的步进版本,ES2版工程样品,进步很大,引入了一些非常必要的功能特性,BIOS也做了全面完善。

核心数量为57、60、61个(很不规整的数字),一级缓存1.8-1.9MB,二级缓存28-30.5MB,显存增加到3、6、8GB GDDR5。

频率方面有多种不同设定,57核心3/6GB显存的600-1100MHz,60/61核心8GB显存的则是630-1050/1090MHz,显存频率达到了5000-5500MHz,带宽超过300GB/s。

值得一提的是,Intel这次引入了Turbo动态加速技术,类似桌面上的睿频,但具体多少个核心能加速到什么程度不详。

热设计功耗,57核心3GB显存、60核心6GB显存的是245W,57核心6GB、61核心8GB(两种版本)的则是300W。

散热方案有主动风扇、被动静音两种,其中被动静音的用于自备大风量的机架系统,但也有完全无散热的,用于自行安装水冷等其它散热器。顺便说一句,这些卡很重很重。

具体性能没有实际数据,Intel的内部目标是单精度2TFlops、双精度1TFlops,从已知情况看难度不大。

C1步进还没出来,会是什么样子还有待观察。

再往后,还有第二代“Knights Landing”,Intel对高性能计算的追求不会停歇。