AMD推土机细节曝光：新增全核心加速技术-DOIT-数据产业媒体与服务平台

DoSERV服务器在线3月1日原创报道：昨天，AMD在京召开了小型媒体沟通会，对外披露了即将在Q3正式发布的推土机芯片（Bulldozer）的技术细节。两周前，AMD正式对外发布了5款全新的皓龙处理器，丰富了AMD服务器芯片产品线，同时，还获得了众多服务器厂商的力挺。在本次沟通会中，AMD服务器产品市场总监John Fruehe为我们全面介绍了AMD目前的产品策略和未来的芯片架构规划。

AMD服务器产品市场总监John Fruehe先生现场讲解

新品获业界厂商热捧

AMD两周前共推出了5款皓龙6100系列的新处理器，具体型号详见下表：

AMD 皓龙61XX处理器	最大热设计功耗	频率	核心
6132 HE	65	2.2GHz	8
6140	80	2.6GHz	8
6166 HE	65	1.8GHz	12
6176	80	2.3GHz	12
6180 SE	105	2.5GHz	12

据AMD服务器产品市场总监John Fruehe介绍，新款AMD皓龙SE处理器能增强关键计算环境的性能，例如，高性能计算、金融服务、数据库和刚做过虚拟化的数据中心。而且这些处理器与AMD皓龙6000系列平台在插槽上相兼容，也将和AMD即将推出的基于16核“推土机”的皓龙处理器相兼容。

AMD服务器芯片规划，每个产品系列都有明确对应的应用环境，可谓是各点击破。

装备有新款AMD皓龙处理器的AMD皓龙6000系列平台已经向OEM厂商和系统制造厂商供货，这些厂商其中包括：Acer、Appro、Cray Inc、Colfax、曙光、戴尔、惠普、Microway、NCS Technologies, Inc.、Nor-Tech、 Penguin、 SGI、Silicon Mechanics 和ZT系统计算机等。

AMD获得了多家OEM厂商的支持

推土机架构揭秘：

即将在Q3正式发布的AMD 推土机芯片架构，这一次由John进行了极其全面的介绍，其实在此之前，我们在一些国外报道中也已经获得了一些关于bulldozer的技术信息，但这一次亲耳听到John的解析，还是感觉更加亲切的。

2003年，AMD首次推出了皓龙服务器芯片产品，那个时候AMD就首次在处理器中引入了集成内存控制器，以及64位计算CPU技术。今年即将推出的推土机架构芯片将延续AMD的创新精神，为客户带来更多的技术革新，下面我们就来看一下推土机架构的一些技术细节。

AMD服务器产品线的规划线路图，最新的就是即将推出的推土机芯片架构。

在Bulldozer模块中为起到提高核密度的目的，AMD把某些组件进行共享，而为了保持甚至是提高性能，把另外一部分保持分离。共享部分包括获取解码并在浮点运算排成器、二级缓存方面共享，这样使得晶圆尺寸更小，从而容纳更多核。在整个架构中，为避免产生瓶颈，仍然维持整数预算调度器的独立性。另外，推土机架构使用的是最先进的32纳米SOI技术。

AMD“推土机”架构中的模块架构图

John Fruehe指出AMD的新一代产品与老一代产品相比，各方面指标都有了极大的提升。与现有12核产品比较，英特拉格斯在吞吐量方面提升到16核，即核的数量提高了33%，而性能提高了50%。按以往的架构排列，提升50%核数量，却只能带来33%的性能提升。

在解析推土机模块架构时，John用了一个有趣的比喻，他认为核心的线程通道可以用北京的交通做比喻，就像两辆车要同时并入一条车道，必然产生瓶颈。我们的设计是为了实现最佳性能和最优的可扩展性。

奇妙的Turbo Core技术——全核心加速技术

John Fruehe先生在介绍Turbo Core技术时表示，“Turbo Core主要是指对于一些没有完全消耗到最大程度的工作负载，去加快时钟速度。在多种不同工作负载上，使用了Turbo Core可以最大增加500兆赫兹的性能。最重要的一点，Turbo Core加速指的是所有核的加速，和有些核加速技术明显不同，以往的核加速技术可能需要关闭一些核，只对部分核进行加速。采用Turbo Core技术，最多可以使所有核增速500兆赫兹，如果再关闭一些核运转的情况下，加速将会超过500兆赫兹。同时我们还对内存控制器进行了进一步优化，从而提高内存的吞吐量。8年前AMD首家推出集成内存控制器，根据AMD在这一领域的经验和非常好的技术，我们又在这一代产品中全面提升了内存控制器的性能。首先我们对内存控制器在效率方面进行了针对性的重新设计和完善，因此实现30%的内存性能提升。在提升30%性能基础上，我们让内存支持1600兆，所以可以获得额外20%的性能。两项加起来，可以实现内存控制器50%吞吐量提升。”

Turbo Core技术介绍

除了每个核心独享4个整数计算管线，在浮点运算上，“推土机”采用了“FlexFP”技术，两个核心共享一个浮点调度器和两个128位FMAC乘法累加器，可以进行组合，每个时钟周期可以完成两次64位双精度计算或4次32位单精度计算。如果一个核心没有进行浮点运算，那么另一个核心可以占用这两个128位的FMAC，在一个时钟周期完成4次双精度运算或8次单精度计算，AMD将其命名为 AVX模式。这种技术保证了“推土机”的浮点运算能力，在高性能计算中并不会因为“共享”而牺牲性能。

推土机在CPU能耗上的优化，加入了对LR-DIMM以及1.25V LV-DDR3的支持，引入了全新的内存能源管理选项，另外，“推土机”的每个核心在空闲、典型负载、最大负载三个状态的能耗要比皓龙6100更低，并且针对FP、缓存等单元进行能耗优化，在整体上降低芯片的能耗。

AMD“推土机”架构皓龙处理器将被命名为“皓龙6200”系列，插槽上兼容现今的皓龙6100，从而让合作伙伴可以迅速推出新产品，并且为用户保护资产。在能耗方面，“推土机”将保持同样的TDP封装，分别为105W、80W和 65W。

AMD推土机细节曝光：新增全核心加速技术

zhabin

相关推荐

近期文章

热门标签