工艺和架构设计都给力,英特尔发布具备多达128个性能核的至强6处理器

2024年6月,英特尔发布了至强6能效核处理器,对标AMD的Bergamo,两者都主打有更多核心,主要适用于云计算和高密度数据中心市场。

2024年9月26日,英特尔发布至强6性能核处理器6900P系列,最高核心数来到了128个,它主打性能优势,在AI、科学计算以及大量通用工作负载上的性能都有大幅提升。

有外媒提到,业内对于至强6性能核处理器的架构设计也给予了较多肯定。从实际数据来看,这一代在能效方面的进步也比较明显,自家的Intel 3工艺有较大贡献。

英特尔在工艺和设计架构上双双都给力表现,才塑造了128个性能核的技术高峰。相信对于接下来面对友商的进攻会有更多的主动权。

首先,至强6性能核处理器基于英特尔的Redwood Cove P-core架构打造的,它是在Golden Cove核心基础上更新而来,整数工作负载上的IPC也有所提升。

英特尔的资深架构师Ronak Singhal指出,虽然IPC是一个重要指标,但在功耗受限的情况下,盲目提升功耗带来的性能未必值得。

所以,至强6性能核处理器更多地关注功耗优化而不是单纯的IPC提升,这意味着,在相同功耗下,至强6性能核处理器可以提供更高的整体性能。

至强6性能核处理器的最显著变化是核心数。从上一代最高64核提高到了128,直接翻倍,而功耗从最高385瓦来到了最高500瓦,增幅仅为29%。这表明在能效方面取得了显著进步。

更好的能效表现部分得益于更先进的制程工艺,性能核至强6采用了混合制程,I/O die是Intel 7,计算die是Intel 3,IO die与计算die是分离的,两者用EMIB连接起来。

I/O die与计算die的分离,大大增强了设计灵活性和可扩展性。比如,用在至强6能效核处理器上的I/O die也可以让至强6性能核处理器使用。又比如,它可以放置1-3个不同的计算die在中间,然后,做出不同核心数的处理器。

至强6系列中有四种不同的的组合配置。其中,最高端的超高核心数(UCC)是这次推出的,此外,还有配备两个计算die的极高核心数(XCC),配备一个die的高核心数(HCC),以及一个低核心数(LCC)变体,它配备一个肉眼可见更小的计算die。

更好的设计,更先进的制程,更好的能效表现,各种有利因素凑在一起,才能造就现在的128核心的至强6性能核处理器。既然核心这么多了,似乎也就没必要做多路服务器了,我们看到,至强6性能核处理器不支持四路或八路插服务器,与上一代保持一致。

说了这么多,不如看看性能表现,或者说单位成本、单位能耗性能提升带来的价值。

如上图所示,与上代相比,平均单核性能提升了20%,平均每瓦性能提升了60%,同等性能水平下,平均TCO降低了多达30%。这些对于云计算领域非常有价值,目前阿里云、腾讯云等都推出或者计划推出基于至强6的云主机,都有不错的成本效益。

在更多实际工作负载中,至强6性能核处理器在通用计算、数据和Web服务、科学计算以及AI场景中,相较于上一代,还有上上一代都有非常可观的提升。特别是在AI场景中,至强6性能核处理器在推理Llama-7B时的性能表现提升幅度非常大。

随着至强6性能核处理器在核心数和算力上的提升,TDP也从300多瓦提高到500瓦,更迫切地需要液冷技术了。在发布会上,英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立介绍了英特尔与一些合作伙伴在液冷技术上的合作与创新进展。

在浸没式液冷上,英特尔与绿色云图合作,解决了油类单相浸没散热的技术难题,推出了基于G-flow创新技术的新平台,为数据中心提供更环保、更低PUE和更低TCO的散热方案。

冷板式液冷方面,虽然该技术较为成熟,但不同厂商存在标准不统一的现象。因此,英特尔与英维克合作,针对英特尔至强6产品进行了早期验证,致力于推动冷板式液冷的标准化。

此外,英特尔与业界合作,推出接口的互换认证和标准化,解决了由于厂商尺寸和质量差异引发的用户顾虑。英特尔希望加速液冷技术在国内市场的成熟发展,为用户提供更绿色、低碳的服务器解决方案。