AMD推土机细节曝光:新增全核心加速技术

DoSERV服务器在线3月1日原创报道:昨天,AMD在京召开了小型媒体沟通会,对外披露了即将在Q3正式发布的推土机芯片(Bulldozer)的技术细节。两周前,AMD正式对外发布了5款全新的皓龙处理器,丰富了AMD服务器芯片产品线,同时,还获得了众多服务器厂商的力挺。在本次沟通会中,AMD服务器产品市场总监John Fruehe为我们全面介绍了AMD目前的产品策略和未来的芯片架构规划。

AMD服务器产品市场总监John Fruehe先生现场讲解

新品获业界厂商热捧

AMD两周前共推出了5款皓龙6100系列的新处理器,具体型号详见下表:

AMD 皓龙61XX处理器

最大热设计功耗

频率

核心

6132 HE

65

2.2GHz

8

6140

80

2.6GHz

8

6166 HE

65

1.8GHz

12

6176

80

2.3GHz

12

6180 SE

105

2.5GHz

12

据AMD服务器产品市场总监John Fruehe介绍,新款AMD皓龙SE处理器能增强关键计算环境的性能,例如,高性能计算、金融服务、数据库和刚做过虚拟化的数据中心。而且这些处理器与AMD皓龙6000系列平台在插槽上相兼容,也将和AMD即将推出的基于16核“推土机”的皓龙处理器相兼容。

 AMD服务器芯片规划,每个产品系列都有明确对应的应用环境,可谓是各点击破。

装备有新款AMD皓龙处理器的AMD皓龙6000系列平台已经向OEM厂商和系统制造厂商供货,这些厂商其中包括:Acer、Appro、Cray Inc、Colfax、曙光、戴尔、惠普、Microway、NCS Technologies, Inc.、Nor-Tech、 Penguin、 SGI、Silicon Mechanics 和ZT系统计算机等。

AMD获得了多家OEM厂商的支持

推土机架构揭秘:

即将在Q3正式发布的AMD 推土机芯片架构,这一次由John进行了极其全面的介绍,其实在此之前,我们在一些国外报道中也已经获得了一些关于bulldozer的技术信息,但这一次亲耳听到John的解析,还是感觉更加亲切的。

2003年,AMD首次推出了皓龙服务器芯片产品,那个时候AMD就首次在处理器中引入了集成内存控制器,以及64位计算CPU技术。今年即将推出的推土机架构芯片将延续AMD的创新精神,为客户带来更多的技术革新,下面我们就来看一下推土机架构的一些技术细节。

 AMD服务器产品线的规划线路图,最新的就是即将推出的推土机芯片架构。

在Bulldozer模块中为起到提高核密度的目的,AMD把某些组件进行共享,而为了保持甚至是提高性能,把另外一部分保持分离。共享部分包括获取解码并在浮点运算排成器、二级缓存方面共享,这样使得晶圆尺寸更小,从而容纳更多核。在整个架构中,为避免产生瓶颈,仍然维持整数预算调度器的独立性。另外,推土机架构使用的是最先进的32纳米SOI技术。

AMD“推土机”架构中的模块架构图

John Fruehe指出AMD的新一代产品与老一代产品相比,各方面指标都有了极大的提升。与现有12核产品比较,英特拉格斯在吞吐量方面提升到16核,即核的数量提高了33%,而性能提高了50%。按以往的架构排列,提升50%核数量,却只能带来33%的性能提升。

在解析推土机模块架构时,John用了一个有趣的比喻,他认为核心的线程通道可以用北京的交通做比喻,就像两辆车要同时并入一条车道,必然产生瓶颈。我们的设计是为了实现最佳性能和最优的可扩展性。

奇妙的Turbo Core技术——全核心加速技术

John Fruehe先生在介绍Turbo Core技术时表示,“Turbo Core主要是指对于一些没有完全消耗到最大程度的工作负载,去加快时钟速度。在多种不同工作负载上,使用了Turbo Core可以最大增加500兆赫兹的性能。最重要的一点,Turbo Core加速指的是所有核的加速,和有些核加速技术明显不同,以往的核加速技术可能需要关闭一些核,只对部分核进行加速。采用Turbo Core技术,最多可以使所有核增速500兆赫兹,如果再关闭一些核运转的情况下,加速将会超过500兆赫兹。同时我们还对内存控制器进行了进一步优化,从而提高内存的吞吐量。8年前AMD首家推出集成内存控制器,根据AMD在这一领域的经验和非常好的技术,我们又在这一代产品中全面提升了内存控制器的性能。首先我们对内存控制器在效率方面进行了针对性的重新设计和完善,因此实现30%的内存性能提升。在提升30%性能基础上,我们让内存支持1600兆,所以可以获得额外20%的性能。两项加起来,可以实现内存控制器50%吞吐量提升。”

Turbo Core技术介绍

 除了每个核心独享4个整数计算管线,在浮点运算上,“推土机”采用了“FlexFP”技术,两个核心共享一个浮点调度器和两个128位FMAC乘法累加器,可以进行组合,每个时钟周期可以完成两次64位双精度计算或4次32位单精度计算。如果一个核心没有进行浮点运算,那么另一个核心可以占用这两个128位的FMAC,在一个时钟周期完成4次双精度运算或8次单精度计算,AMD将其命名为 AVX模式。这种技术保证了“推土机”的浮点运算能力,在高性能计算中并不会因为“共享”而牺牲性能。

 

 

推土机在CPU能耗上的优化,加入了对LR-DIMM以及1.25V LV-DDR3的支持,引入了全新的内存能源管理选项,另外,“推土机”的每个核心在空闲、典型负载、最大负载三个状态的能耗要比皓龙6100更低,并且针对FP、缓存等单元进行能耗优化,在整体上降低芯片的能耗。

AMD“推土机”架构皓龙处理器将被命名为“皓龙6200”系列,插槽上兼容现今的皓龙6100,从而让合作伙伴可以迅速推出新产品,并且为用户保护资产。在能耗方面,“推土机”将保持同样的TDP封装,分别为105W、80W和 65W。