Xeon Phi配备50个以上的核心,每个核心单元包含一个512位的向量单元处理器,能够使用x86指令集运行Linux系统,整个系统被集成在单个芯片上,但之前公布的情报仅限于此,并没有产品架构的详细资料,在Hot Chips大会上,英特尔Xeon Phi首先架构师向与会者披露了Xeon Phi的更多细节情报。
Xeon Phi的总线结构不是完全不同于IBM的Cell处理器,其和AMD R600类似,采用512位带宽的GDDR5双环形总线,不同于Cell缓存部分由软件进行管理,Xeon Phi带有TLB页表缓冲的512KB L2缓存是由硬件自动控制,不需软件过多干预,缓存由标识目录进行管理,使得任何独立的访问请求都可以访问整个系统缓存。
除此之外还有一些很讨巧的设计,和NVIDIA的Tesla类似,Xeon Phi的每个计算核心也都包含一个EMU扩展映射单元用于加速处理类似平方根、倒数和指数这样的复杂数学运算。另外内存控制器也不是集中在一起,而是位于环形总线的50个核心之间,这样的设计可以大大降低延迟和数据请求需求。
如果50个核心都全部运行在2.5GHz的最高频率,那么双精度峰值计算能力则有可能高达1 TFLOP,并且最终产品规格会大于现在50核心规模,实际性能会更好。
不过在实际环境应用计算效率不可能达到100%,英特尔也着手优化缓存架构,另外一方面当前设计没有充分为单精度浮点计算优化,而在这方面竞争对手 NVIDIA和AMD的产品在图形代码执行效能上更好,英特尔也会通过进一步的缩减核心规模而增加向量单元数量来改善这方面的性能。