高能效和绿色化可以兼得 英特尔打造面向AI时代的算力

引言

【算力豹导读】在数据量呈指数级增长的当下,AI技术的发展势头迅猛,其在各行各业的应用不断深化,从智能语音助手到复杂的机器学习模型,AI技术正在推动着一场技术革命。无论是过去几年中,基础超大模型为主流的训练,还是现阶段,多模态模型和中小模型推理的大规模需求,都需要大量计算资源的支持。

与此同时,高能效和绿色化成为了AI时代计算需求的两大核心特质。高能效意味着在提供强大算力的同时,也需要考虑能源消耗和投入成本,这对于数据中心和云计算服务提供商(CSP)而言尤为重要。而随着算力需求的与日俱增,无论是硬件功耗还是整个数据中心的资源消耗,以及是否能实现长期的可持续发展,也是厂商需要面对的巨大挑战。

在近日举行的英特尔新质生产力技术生态大会(Intel Connection)上,英特尔展示了自身在产品技术方面的探索,并携手众多生态伙伴发布一系列联合解决方案。

未来数据中心的“基石”

英特尔至强6处理器家族采用Intel 3制程工艺,包括性能核(P-core)和能效核(E-core)两个微架构版本,针对包括AI在内的各种工作负载进行了深度优化设计,两款处理器的组合可以将数据中心的性能和效率提升到新的高度。

今年发布的英特尔至强6能效核和性能核处理器,均具备高核心密度及出色的每瓦性能,可在提供高效算力的同时显著降低能源成本。

其中,英特尔至强6能效核处理器具有显著的密度优势,对于有产品迭代需求的用户来说,可以三比一的比例进行旧系统替换和机架整合,这将大幅节省计算集群功耗并显著降低碳排放,加速实现企业可持续发展目标。

此外,英特尔至强6能效核处理器还具有出色的能效表现,与第二代至强相比带来4.2倍的机架级性能提升2和2.6倍的每瓦性能提升,是在电力、空间和散热受限的情况下的理想选择,并具备更大的内存带宽,出色的输入/输出能力,内置众多加速引擎以及具备多达64条CXL 2.0通道,能够为高并行和大吞吐量的云级工作负载带来更高性能和能效,并满足SLA要求。

英特尔近期推出的至强6性能核处理器,凭借最高达128个内核的配置、双倍内存带宽、内置AI加速功能,一方面可以直接加速AI推理;另一方面,至强6以其强大的算力与内存优势,成为AI服务器的首选“机头”。事实上,目前超过70%的GPU加速服务器选择了英特尔至强CPU作为其“机头”。

在云计算领域,英特尔至强6处理器在每路核心数、单核性能、每瓦性能方面,相比上一代处理器均有显著提升,可帮助云服务提供商有效降低计算成本。与第五代英特尔至强可扩展处理器相比,至强6处理器拥有多达2倍的每路核心数,平均单核性能提升高达1.2倍,平均每瓦性能提升高达1.6倍,同等性能水平下平均节省30%的TCO。同时,在数据中心常见的通用计算、数据和Web服务、科学计算和AI等工作负载中,至强6性能核处理器在性能和每瓦性能上,相比上一代处理器也有显著提高。

生态的力量

人工智能时代,更强大的AI需要更强大的通用算力。

但如何快速完成CPU到计算系统的创新,使其能够适用于多样化的应用,是缓解当前算力资源紧张的关键。浪潮信息与英特尔联合产业伙伴,共同定义了标准化、模块化的开放算力模组设计规范(OCM),通过开放合作与融合创新,统一算力单元对外高速互连、管理协议、供电接口等,构建CPU的统一算力底座,让多元化的应用场景能够快速找到贴合的方案,激发算力创新活力。

浪潮信息一直秉持多元异构发展的理念,以应用为导向,以系统设计为核心,打造算效先进、稳定可靠、一致性强的服务器产品平台。激发创新活力,开源开放是核心和源泉。通过开源开放,可以更好地聚合产业生态,推动创新技术的产业化应用落地。

浪潮信息基于模块化架构的NF3290G8服务器,搭载英特尔至强6处理器,实现算力标准化,支持灵活扩展,简化运维。该机型以其前后窗设计的灵活性,可适配AI加速卡或智能网卡,满足多样化需求。集成诊断预警、智能感知、能耗优化功能,特别是首创的DMPU故障诊断模块,实现纳秒级噪声定位和底层日志分析。环境感知技术使服务器快速感知温度,控制噪声,提升运维体验,并通过电源设计降低能耗,也彰显了产品技术创新带来的重大进步。——浪潮信息服务器产品线总经理赵帅

在大模型训练中,AI硬件的内存发展与算力增长速度不匹配,会导致“内存墙”的问题。基于英特尔至强6性能核处理器打造的超聚变CXL 2.0内存池解决方案,能够实现集群内内存资源的弹性分配和数据共享,优化业务配置和调度;并为容量型业务扩展内存空间,为带宽型业务提升总带宽。

得益于该方案,在AI训练应用中,可实现秒级checkpoint数据备份和恢复,让模型预训练和微调更加高效;在AI推理应用中,CXL内存池可以承载KV cache,从而有效减少计算次数,多用户实时推理性能将得到极大的提升;在数据库场景中,该解决方案不仅提供了超大内存,还减少了近99%的无效I/O。——超聚变服务器产品总经理朱勇

在算力不断扩展突破、电力逐渐成为限制因素的情况下,同步实施更高效节能、更绿色环保的液冷方案也尤为重要。英特尔一贯秉持可持续发展的策略,与合作伙伴共同加速数据中心节能技术的落地和应用。

随着数据中心承担越来越多的工作负载和能耗密集型任务,电力等能源消耗正在迅速增加。液冷技术正成为数据中心应对这一能耗挑战的关键解决方案。

在浸没式液冷方面,英特尔联合绿色云图成功突破油类单相浸没散热能力有限的技术难题,推出基于英特尔G-flow创新技术的平台解决方案,为数据中心提供了更环保、PUE和TCO更低的新一代散热技术。与传统Tank比,在无需额外能耗的情况下,可利用低成本、绿色环保的合成油作为冷却介质来解决千瓦级散热问题,进而降低数据中心的运营成本和环境影响。

在冷板液冷方面,一方面英特尔联合英维克推出了首个基于Birch Stream-AP平台的本土冷板液冷整体解决方案,其中包含冷板、CDU、分水器、快接头。该方案通过验证,并成功导入英特尔全球Birch Stream-AP平台冷板液冷供应商推荐名单,极大助力本土合作伙伴拓展全球业务,加强全球出海的生态系统。

同时,英特尔还与产业链合作伙伴携手,发起了可互插通用快接头(UQD)的互换测试验证项目,以加速液冷行业快接头的标准化落地,推动液冷产业规模化进程。

此外,英特尔去年启动了中国数据中心“液冷创新加速计划”,联合行业伙伴开发多元化的液冷绿色解决方案,为数据中心产业的绿色转型提供灵活多样的选择。

除了液冷,英特尔中国数据中心关键部件验证计划授牌仪式也在活动期间举行。忆联(Union Memory)成为SSD领域首家关键部件验证计划的合作伙伴,未来双方将深入协作,基于英特尔至强6处理器助力忆联的新一代PCIe Gen5 SSD 在诸多存储应用场景中发挥性能优势。

英特尔中国数据中心关键部件验证计划是英特尔中国数据中心平台系统工程部门与合作伙伴共同协作,对服务器内部的关键部件,如SSD、内存等,在至强平台上进行设计创新及全方位的兼容性、可靠性、功能性验证。这不仅将加速最终用户采纳合作伙伴的最新产品,也将助力构建一个高效、优质、健康的中国本地化至强服务器生态供应链。

英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立表示:“衷心感谢忆联在此次大会上展示了多款高效、安全且可靠的存储产品。我们期待双方能够深化合作,携手并进,共同推动创新与发展,打造出更多品质卓越的产品,为客户提供更出色的行业解决方案。”

忆联总经理寇朋韬表示:“作为一家扎根于国内的闪存SSD厂商,忆联具备从算法到模组生产加工并交付的端到端能力。能够成为英特尔的合作伙伴,忆联深感荣幸。我们期待通过更加紧密的合作,一同推动算力与智算产业的蓬勃发展。”

结语

在AI时代,算力需求日益增长,而高能效与绿色化成为行业发展的重要趋势。英特尔凭借其创新技术和前瞻性布局,成功实现了高能效与绿色化的完美融合。面向AI时代的算力需求,英特尔联合生态伙伴致力于打造高效、环保的计算解决方案,为推动人工智能产业发展贡献力量,同时助力我国实现绿色低碳发展目标。