英特尔至强6的这项独享功能,可以更好地缓解内存瓶颈

原标题:缓解内存瓶颈的新路径,英特尔至强6独家” MRDIMM

2024年,英特尔发布了最高128核心的6900P系列英特尔至强6,未来可能还有核心更多的处理器。在核心数猛增的情况下,如果内存技术没有什么变化,意味着每个核心分配到的内存带宽减少,如果数据无法交给核心,核心增多的意义就大打折扣。

为了应对这些问题,英特尔在努力打造与之匹配的内存系统。我们看到,英特尔至强6 6900P系列已经将内存通道数从8个提升到了12个,同时对CXL的支持也进一步成熟。除此之外,英特尔至强6性能核还率先支持MRDIMM,大幅提高内存性能。

英特尔至强6率先支持MRDIMM,独享这一技术

2024年,英特尔发布了支持MRDIMM技术的英特尔至强6性能核处理器,这是目前业内唯一一个支持MRDIMM技术的服务器处理器,此前发布的英特尔至强6能效核处理器,以及AMD最新的服务器处理器都暂不支持。

英特尔从第四代英特尔至强可扩展处理器开始支持DDR5 4800内存。DDR5不仅带来了更大的单条容量,也带来了更高的内存传输速率。尽管现在至强6已经提高到了6400MT/s,但远远赶不上核心的增幅,而MRDIMM则开辟了新的提升路径。

数据中心常用的RDIMM(注册内存模块)设计通常包括两个内存阵列(性能阵列和容量阵列)。RDIMM虽然可以让内存读和写发生在多个阵列之间,但却无法同时进行,也就是说,每个周期(Cycle)同一时间只能对一个Rank(阵列)进行读取或者写入。

图片:来自SK海力士

为了解决这个问题,聪明的工程师通过在 DRAM 模块中引入多路复用器(Mux),利用片上数据缓冲区,让数据在同一个时刻跨两个阵列(Rank)进行传输,每个阵列(Rank)64个字节,实现了128 字节的同步传输,从而大幅提升带宽和性能。

由此诞生了英特尔有史以来最快的系统内存。峰值带宽从英特尔至强6默认支持的6,400MT/s跃升至8,800MT/s,提高近40%。这种幅度的提升,按照过去的方式大概需要经过3代才能实现。

从英特尔技术专家的介绍中了解到,MRDIMM从2018年开始做原型设计,到如今正式发布已历经了很多年。之所以在至强6这一代开始支持MRDIMM,主要是因为,MRDIMM的8800MT/s内存与英特尔至强6性能核处理器性能非常匹配。

MRDIMM的落地几乎没有任何障碍

MRDIMM和现有的DDR5内存生态有很好的兼容性。英特尔不仅于2022年底将组件规格作为新的开放标准捐赠给了JEDEC,成为了JEDEC标准。而且,还一直都与内存厂商保持深度合作,目前三星、SK海力士、美光等都推出了相应的内存产品。

MRDIMM的技术生态非常完善。MRDIMM采用与常规RDIMM相同的连接器和外形规格,无需对主板做任何更改。同时,它还具有与RDIMM相同的RAS功能。这意味着,数据中心客户可以直接用上MRDIMM,不需要更改任何代码。

MRDIMM带来的性能优势非常明显。有媒体测试对比了两套配置相同的至强6系统,分别使用MRDIMM和RDIMM。测试结果显示,使用MRDIMM的系统在完成速度上比使用RDIMM的系统快了33%。

英特尔专家表示,MRDIMM带来的带宽提升,对于内存带宽敏感型应用非常受用。它非常适用于小语言模型、深度学习、推荐系统、科学计算、内存数据库等工作负载。未来,随着12800MT/s和17600 MT/s MRDIMM的推出,提升效果会更明显。

第五代英特尔至强可扩展处理器的最高核心数为64个,而至强6900P的性能核处理器则达到了128核,在这种翻倍的提升面前,不仅需要MRDIMM带来的40%带宽提升,因此,英特尔也在推动CXL等技术的落地。

解决内存瓶颈的其他方式

当然,有朋友会注意到HBM技术在提高内存带宽方面的价值。英特尔也曾将HBM集成到了x86处理器,推出了至强CPU Max处理器。但事实证明,用HBM来解决通用处理器内存瓶颈问题,可能还有待进一步探索。

实际上,现在单路服务器里MRDIMM的带宽,基本与英特尔CPU Max里HBM提供的带宽持平。此外,HBM不仅提供的带宽有限,而且需要特殊封装,所以不仅通用性比MRDIMM差,成本也会高出很多,其容量上限也远不如MRDIMM。

英特尔专家认为,CXL是另外一个比较推荐的缓解内存瓶颈的方式,这是一种灵活、高性价比的内存架构。与MRDIMM和HBM等追求极致带宽和性能的技术不同,CXL 更注重灵活性和成本优化。

它既可以提供内存扩展器来扩展本地内存,也可以通过搭建CXL 内存池共享内存资源,而且通过支持DDR4内存,它可以提供更有性价比的内存资源。此外,其在某些场景下的性能可达到传统内存的 90%-95%,可以很好地满足业务系统对内存扩展的需求。

鉴于这种灵活性和低成本的优势,CXL的内存扩展方案更受欢迎。目前,CXL的生态正在逐步完善,各种基于CXL的创新产品正在快速涌现,应用场景也不断拓展。不久前,英特尔还宣布了一项与阿里云的一项关于CXL的合作,可以看到CXL的技术和生态都正在日渐成熟的过程中。

英特尔至强6可以更好地支持CXL,提供更强的CXL内存分层支持,而且,目前只有英特尔至强6处理器可以实现Flat内存模式。搭配MRDIMM技术,英特尔至强6可以最大程度上缓解内存瓶颈问题,而这也正是市场上其他服务器方案所不具有的优势。