从800到1333 英特尔处理器前端总线变形记

        在今年的第三季度,Intel将推出了1333MHz总线的桌面版处理器。而它目前的高端至强处理器,已经跑在了这样的高速路上,既然是同根而生,难道有这么大的区别吗?


  相比桌面运算系统,Intel早就给服务器系统准备了1333MHz总线,至强5335不仅总线速度高,价格甚至还要比频率稍低的至尊版更便宜。


  可能是因为服务器领域对总线的要求更高,大量的数据请求需要在同时并发,这样,1333MHz总线就能够体现出优势来了。服务器领域尝了鲜,但要付出的却不会因为处理器价格便宜而有所收敛,不同的芯片组加上内存等,一系列算下来,成本可要高上很多。


  有没有别的办法呢?最简单的就是等待,Intel预计在今年的第三季度推出1333MHz总线的桌面产品,为了凸显与以前产品的不同,在处理器的型号上做了一些改动,改为EXX50。这好像是Intel的惯用伎俩,升级改动比较小的或者不是顶级系列的产品,往往就在后面添加一个类似5的后缀,这样的事情在主板领域就更是不计其数了。只提高总线的运行频率,并不会带来太多的性能提升,所以Intel还是很乖巧的,并没有使用更为激进的命名方式,尤其是一些对数据交换不是很敏感的应用。这个名字的改变,其实还代表了不同频率产品的出现,号称总线为1333MHz的产品,基频已经达到了333MHz,所以按照以前的倍率,处理器的频率会稍有些提升,计算能力也会得到提高。


  不过Intel也发现,单纯提高处理器的频率,效果已经不是很明显了。每年几十亿美元的研发所带来的性能和架构的改变,很容易就被微软这样的软件厂商浪费掉了,一些不知名的软件也很可能让它的英名扫地。改进架构是一个方面,而提高电脑系统里面真正的瓶颈??存储是另一个好方案。尤其是Intel最近也比较专注混合磁盘的研究,估计等非易失性存储设备成为内存之后,这方面的担心会少一些。


  可这些都是远水,真正让我们提前进入这个时代的是超频。我们想办法把手头的QX6700外频提到了1333MHz,最后居然还成功登上了1400MHz的顶峰,这让我们兴奋不已。可选的精英主板倒是挺多,电压甚至可以按照0.0125V的幅度调整,不过就是有些不准,比如电压调整,有时候通过BISO把电压调整上去了,但实际结果却是降低了。


  还有一点很麻烦的是,要调整内存的参数以及不同频率之间的搭配,不能仅仅考虑处理器,还要考虑到周边的一些情况,一旦某个条件无法满足都会让我们前功尽弃。且不说为了让系统能够正常运行,就是为了能够让处理器进入Windows就已经是很让我们高兴的了,然后再继续慢慢一步一步地调整,不仅需要耐心,还要慢慢地思索一些变化。


  实际上,到了1333MHz已经差不多触顶了,处理器开始变得不够稳定,一些测试也是莫名其妙地过不去,要么是因为过热,要么是因为内存错误,烦不甚烦。每次失败之后,还得重新来过,时间就这样被浪费掉了。问题是,各种参数的搭配相当多,我估计试验了上百次才捉摸到了一点门道,提高了内存和处理器的电压,而把总线的终端截止电压降低,总算成功了,此后诸事顺利。1333MHz之旅从此展开……


  提前感受1333MHz


  先说平台,我们选择的是精英NF650iSLIT-A,只能算是一个二流的产品。本来没有想到能够实现总线的超频,却是源于这个主板居然不支持倍频往高处调整,只有往低调,这点连Intel的原装主板都比不上,好歹它都允许电压倍频调整,把处理器超频到3.43GHz是一点问题都没有,难道这个板子这么一点能耐都没有?没有这个能耐,但却有另外一个能耐,最大外频能够达到的是处理器所达不到的,内存支持也是相当了得,是市面上的产品几乎都达不到的。


  且不管它。最重要的是,它提供了完善的手动选项。我还在暗想,nVIDIA的芯片组就是不一样,做出的板子都与众不同,不过要是想充分利用其中的选项,没有几天几夜的仔细搭配估计也是白搭,偶尔玩玩到是没什么问题。像我们这样超频之后还要经历测试,估计就不行了。


  这让我们看到了一丝曙光。Intel的这块QX6700能不能顺利实现我们的愿望呢?看看它的同胞兄弟,都能在速度更快的总线上运行,估计这个余量是没有问题的。而我担心的是四个核心超频之后,主板供电应付不了,所以在电压调整上都比较谨慎。Intel的原装主板都能够实现四核和双核的转变,而精英的这款就差点意思了,居然没有。这就是差异,最初X6800测试的时候,能够勉强到3.73GHz,这应该是Intel现在的频率极限。不过,Intel倒是不太在意处理器的频率提升,尽管IBM放出话来,要超过4GHz,达到5GHz甚至6GHz,不过这个离桌面运算还是远了点。


  1333MHz总线的确是很快,不过由于内存不同步,貌似需要做一些缓冲,因而一般来说第二次测试的成绩会相对好一些。另外,我们还是用了DDR2 800,表面看来有些寒碜,不过对处理器的性能影响并不大。Core2架构以计算为中心,频率的变化对计算能力的影响更为显著。不过,也出了一个小意外,由于1400MHz总线并不标准,我们发现测试商用性能的时候,系统得分反而更低了,最初还怀疑是硬盘的问题,结果发现是因为系统总线不同步,导致的同步时间消耗过多,得分也就降低了。


  而对渲染这样的运算,倒是很需要强大的前端总线,读写的东西变得相当快,尤其是四核协同作战的时候,效率提升了很多。我们也发现了不同的算法对处理器利用率是不同的:基于循环式的运算,对处理器的利用率几乎是100%,多核性能的提升基本上是100%;而基于递归方式的运算,处理器的利用率要打折扣,这也与操作系统的任务调度有关。


  另外,我们还注意到,QX6700的巨大缓存还是起到了很大的作用,四个核心,一共8MB缓存,对测试的第一次和第二次的结果影响巨大,尤其是随机读取比较多的测试。而对循环套用比较多的测试,也因为缓存巨大而有所收获。


  这样看来,1333MHz总线似乎更适合四核以上的处理器。一方面是因为Intel总线架构决定了处理器之间的通信也必须通过总线实现,总线速度提高,核越多效果越好;并且这也将影响处理器的使用方式,只能是尽量减少对总线的依赖,降低处理器之间的通信,尽量减少递归的应用。


  所以,1333MHz首先出现在服务器领域还是有道理的,它们服务的对象都是多线程,因而差距可能就会有25%的样子,就像我们测试的Cinebench和POVWin的差距。至于我们通常的应用,可能是在打开电源的那一刹那,感觉进入系统似乎快了一些,至于其他的,总线能够带给我们的就很少了。


  测试情况解析


  在这次测试中,主要是得益于处理器频率的大幅度提升,从而使得整体性能得到了跃升。比如,特别仰赖处理器频率的渲染,以及一些多媒体的应用,因为处理器频率的提升,性能差异比较明显。另一方面则是因为有些项目数据交换比较多,所以仰赖操作系统进行调度,加上Intel处理器的核之间通信需要与芯片组沟通,导致了一些阻塞问题,也因为总线速度的提高而有所改变。


  在四核处理器的运算中,核间通信问题对系统性能的影响较大。这也是因为Cinebench这样的渲染软件,比较仰赖处理器之间的通信,使得多核性能提升的幅度大大减小。比如,在双核条件下,它的最大性能提升能够达到1.87倍,这是考虑到操作系统所能够实现的最大倍率提升。而四核最多就是3倍的水平,也就是说大约有一个核的计算能力被消耗在任务分配方面了,损失还是相当惨重的,这样对总线的依赖就比较大了,总线的快慢将很大程度地影响最后的测试得分。


  POVwin就不同了,它预先做好了分配,并且很少有处理器之间的通信,每个核预先分配好一定的工作量,让它们各自把自己的工作运行完,这样反而多核的性能提升得非常快。它的重点是在任务的提前分配上,因而这个阶段耗时比较多,不过与单核比较起来,性能的提升幅度就比较大了,达到了4倍,简直就是一个倍增器,一般很少能够看到这么大幅度地性能提升。


  不过,这也暴露了一个问题:看待多核与单核,还需要注意不同的软件和不同的算法带来的差异。当然,Intel没有在处理器内部集成内存控制器,在一定程度上影响了核与核之间的通信,也就是说,Intel处理器的核心缺乏核与核之间的通信机制。根据规划,在不久的将来,Intel可能首先在服务器端推动集成内存控制器的处理器,相信它们也将会在处理器内部实现核与核之间的通信机制,因为如果不很好地解决这个问题,将很难应付未来的多核时代。


  IBM的做法就聪明多了,也把这一招仍给了AMD。加上AMD数次攻击Intel假多核,使得Intel也反唇相讥,说AMD是自取灭亡,原生多核处理器的生产风险太高,导致成品率无法大幅度提高。所以,不管是何种机制,有一点很明确,就是Intel处理器的核间通信问题必须解决。


  AMD的架构很适合多数据量在多核之间的穿行,因而更适合服务器领域的应用。在这种条件下,计算的重要性可能放在次席,相比之下,处理器的通信能力更为重要。


  这让我们感受到,不同的软件对处理器的不同应用方式可能带来不同的功率消耗。为了对比不同软件对处理器的应用情况,我们拿来了海韵电子的功率表,发现功率之间的差异,籍此,我们也看到了软件利用处理器之间的效率差异。结果很有意思,像Cinebench对处理器的利用率明显比POVWin低,全功率下要低10多瓦;而在单核条件下,操作系统对处理器功耗影响比较大,因此效率相差不大。另外,Cinebench对处理器资源利用不足还来自它利用处理器时候的功率波动,POVWin却要稳定得多,这种巨大的差异是一个很明显的暗示,POVWin的算法要更优秀。但对多核的应用,软件的分量似乎更大。


  我们还需要注意的是,Intel的四核处理器本身给操作系统的认知就是一个递归的过程,它是通过类似HT的技术,通过两个核再虚拟出两个核,以便取得操作系统的识别,而这两个核与HT技术不同的是,它是实实在在的,这也在一定程度上影响了Cinebench的性能。


  附件功不可没


  除了精英主板这样的主力悍将,散热器和电源也是功勋卓著。精英这款板子已经让我们对它刮目相看了,最近也从同事嘴里听到了对它的认可,很难得,精英逐渐得到了认同。而精英也在逐渐改变以前只做廉价产品的形象,像NF650iSLIT-A这款板子这么出色,也是我没有料到的,可以把QX6700从2.66GHz冲上3.5GHz,内存调整功能的丰富加上选项的繁多,已经足够了。


  不过也存在问题,这款板子启动特别慢,尤其是在更改BIOS之后,很让人心悬,总让人怀疑是不是不成功了,不过它带给我的还是喜悦多于失望,值得推荐。


  话又说回来,因为处理器频率的提升,功耗就提高了,就需要增加电压以弥补标准电压下功率的不足,这就会对主板提出相当苛刻的要求。QX6700标称最大功耗为125W,超频之后,频率提升了30%多,而功率提升一定超过了30%,这就意味着主板的供电必须接近200W的峰值,同时散热器如果不够好,也可能就烤糊了。


  我们选择的是海韵电子的600W电源,效率超过80%,功率因素在324W的时候达到了98%;散热器则是华硕的新款SilentKnight,全铜制造,热管加风扇,十分安静,最重要的是,散热能力很强。在QX6700默认频率、室内温度20℃下,处理器温度只有22℃,超频到3.5GHz,温度也就上升3度,这是风冷方式中相当惊人的成绩。


  这一套东西搭配下来,实现了我们的超频梦想,也让我们提前感受到了1333MHz的威力。而海韵电子的600W电源也相当安静,如果不是华硕显卡的散热风扇太大,这几乎是一个完美的组合了,如果封装在机箱里面,我们将几乎听不到任何噪音。


  这次测试也让我们看到Core2架构的潜力,不仅频率潜力惊人,就是外频的变化也让我们刮目相看,尤其是一些渲染类的软件,对外频的仰赖还是很大的。1333MHz对于那些经常需要视频处理的用户来说,是相当好的消息。可是,什么时候才能把硬盘这个瓶颈解决呢?这不是仅仅通过改接口就能解决的问题,说不定,在1333MHz总线之后,这是下一个议题吧。


  链 接:总线频率与处理器频率


  总线频率一般是低于处理器频率的,处理器与总线之间通过倍频实现同步。总线频率就如同整个系统的基准频率一样,实现I/O、内存等与处理器之间的数据交换。


  既然外频跟前端总线的频率是呈倍频关系,知道了总线频率,也就知道了处理器的运行频率(在倍率一定的情况下)。处理器的频率就是CPU频率=FSB频率×倍率。同一级别的处理器,处理器厂商往往通过设定不同的倍频,实现频率差异,从而制造出不同的处理器,从本质上说可能基本一样的,只是品质上略有差异而已。


  这就直接导致了超频。超频专家认为,只要是同批次的产品、同样的工艺、同样的体系结构,那么处理器的最大工作频率就是相当的,只不过有些能够更稳定一些,而大部分在这个频率下可能不能用。


  在处理器的制造过程中,可以利用新的工艺逼近硅材料的极限,比如Intel的拉伸硅技术,还有未来的high K技术,都会让处理器的功耗和频率带来变化。但是,频率高的处理器面临的问题更多,它们的发热量更大,功耗并不与处理器的频率完全成正比。一般来说,处理器的功耗大部分是被缓存消耗的,它们需要通过持续的电流保证数据的存储,而计算逻辑的开关模式跟频率成正比,这是理想的情况;而超频之后,泄漏电流增加,无用功耗增加直接导致处理器发热大大增加,使得继续超频成为不可能。


  这就要加强散热,但是一定材质和体积的晶体管密度的产品,散热的能力就确定了,为了获得更多的超频能力,需要采取极限措施,比如液氮、半导体以及干冰等制冷,把处理器频率提升到新的水平。


  频率增加、制造工艺提高,这就会带来新的干扰,虽然工作电压降低了,但是降低到一定程度硅也就不可用了。比如,硅的开关电压是0.7V左右,现在处理器最低工作电压已经在1V左右,空间已经很小。而超频过程中增加电压,按道理对提高处理器的频率是不利的,这么做主要是为了提供给处理器足够的、在高频率下的功率。


  Intel目前使用的是QDR数据传输触发形式,也就是说,把地址寻找和数据传输分开,在一个周期的4个拐点进行数据触发,从而把实际的数据传输4倍乘积,1333MHz的总线频率对应的实际频率为333MHz。


  AMD采取了不同的策略,它把总线内建于处理器,使得处理器成为信息交换的中心,这能够大大提高数据交换的效率,使得它能够特别适合服务器应用,并且处理器之间的直接通信也成为可能。


  从现在来看,Intel处理器在计算能力上还有很大的空间,因而提升总线频率意义重大,还会让未来的四核主流处理器的性能得到大幅度地提升,同时也为未来强悍的集成图形芯片提供了很好的空间。