众所周知APU将CPU和GPU完美融合为一体,这是AMD在多年之前的愿望,也是这家能同时生产CPU和GPU的芯片厂商应该利用的技术优势。经过了一年多的市场和用户考验,APU已经用销量证明了自己的强大实力,而最新的Trinity APU也已经来临,整体性能的进一步增长让我们看到了融合的威力。同时AMD精心培育的异构加速应用环境,也得到了更多厂商的响应,GPU已经不仅是图形专用处理器,而是成为日常生活中不可缺少的一部分。
CPU与GPU终于得到融合
从2011年开始,英特尔Sandy Bridge处理器和AMD Llano APU的上市,一个CPU与GPU真融合的时代已然到来。虽然从发布时间来看,英特尔凭借其强大的半导体制造工艺率先发布了第二代智能酷睿处理器,但在异构计算方面,AMD却整整领先了英特尔一代(Ivy Bridge已经实现CPU+GPU异构计算加速)。
全新Trinity APU可以做到17W超低功耗
在面向笔记本的移动市场上,全新Trinity APU的晶体管数量从Llano APU的11.78亿个增加到了13.03亿个,由于制造工艺还是32nm不变,所以核心面积也从228平方毫米上升到了246平方毫米,但功耗方面却有所下降,移动版Llano APU的功耗为35-45W,而Trinity APU的功耗则控制在了17-35W,不过桌面平台还是65/100W不变。
APU逻辑构成与总线连接
通过全新Trinity APU我们可以看到,GPU核心还是占据了芯片的大部分空间,与上代相同在芯片的内部整合了北桥,而且将两个CPU核心整合成一个"X86架构双核模块",因此一个四核的处理器只有两个"双核模块"。另外一个比较大的改进就是Trinity APU开始原生支持DP和HDMI输出。
统一北桥带来更方便频率控制
除了在性能和加速方面的考虑之外,AMD还深度依靠半导体工艺,通过提升频率的方式来促使性能线性增长。所以APU的频率拥有CPU和GPU两个部分,我们经常称APU超频为"双超频",其含义就是可以同时调节CPU与GPU频率。
APU拥有统一北桥设计
Trinity APU 内部有一个全新的 UNB "统一北桥",这是 AMD 专门为 Trinity APU 所设计的通过内部 PCI-E 通道取代传统的HT总线传输,它内部集成了 SRI 系统请求接口、Crossbar 交叉开关矩阵、连接控制器和内存控制器。它可以支持显存控制、内存控制、APU电源管理以及双核心预算模块与显存、内存之间的数据交换和访问。
APU内部拥有足够的内存带宽设计
得益于AMD在内存控制器设计方面丰厚的经验和优势,这一次AMD在APU中大胆的采用了通过CrossBar直接将CPU和GPU连接在同一个内存控制器上,同时整个APU内部的各个组件由HyperTransport总线连接成一个整体的方案。其中CPU与GPU分别拥有独立的Cache和 buffers缓存,并且可以共享内存进行数据交换。
APU内部的GPU只需要直接使用CPU的内存控制器就可以实现对内存的访问。摆脱了繁琐的绕路和带宽瓶颈后,GPU等模块与内存控制器之间的通道以及内存控制器和内存之间的带宽都达到了27GB/s左右。再加上GPU通过内存控制器可以直接访问内存,带宽的提高让GPU的执行效率也得到了大幅度的提升。
AMD处理器在K8到K10.5这段时期,时钟发生器都是在 CPU的外部,一般是位于主板的南桥中。时钟发生器的默认频率为100MHz,CPU的外频是通过对这个频率放大后得到的。超频时的改动外频操作,实际上是改变这个放大系数,时钟发生器频率本身是恒定的,因此超外频时PCIE等设备的频率不会发生改变。Llano APU采用了类似SNB的设计,取消了传统的HTT ref Clock作为外频,而是把北桥和时钟发生器都集成到了CPU内部,因此Llano APU的外频是以内置的时钟发生器频率为标准。
不锁倍频的黑盒版APU更适合超频
具备CPU+GPU双超频能力的APU不但可以通过主板BIOS调节频率,还可以通过AMD推出的OverDrive软件在操作系统内部调节进行超频,OverDrive是一款集系统检测和超频于一体的系统调节优化软件,不但能够随时监控各个组件的状态,还能优化性能、保证稳定性。APU在频率方面的优势也造就了K系列的APU处理器,AMD在K家族是毫无疑问的鼻祖,早在速龙二代的时候黑盒处理器就成为了主流DIY的宠儿,在APU平台俨然已成 AMD主流平台之际,黑盒APU出现能够有效吸引中高端超频和游戏用户,让AMD DIY市场更加火热。