【深度观察】当智算遇到1024程序员节!浪潮信息元脑服务器与新华三H3C UniServer G7新品齐登场

引言

【算力豹导读】

2024年10月24日,众多算力新品齐登场,元脑®服务器第八代新品重磅发布!新华三发布十余款智算新品,建立多元异构算力平台。

元脑®服务器第八代新品发布会重磅来袭

会上,浪潮信息重磅发布元脑®服务器第八代算力平台,基于开放架构设计,业界率先实现“一机多芯”,同一架构支持英特尔®至强®6处理器及AMD EPYC™ 9005系列处理器,在促进多元生态共进的同时,具备更全面的智能能力和更高能效,更好支撑AI大模型开发与应用创新。实测数据表明,在LLaMA2大模型AI推理场景中,整机性能较上代最大提升3倍。

与此同时紫光股份旗下新华三集团“乘势·进化·臻于智境”智算新品发布会也如火如荼的举行

本次大会汇聚业界权威研究机构、智算产业链上下游合作伙伴、重点行业客户等产学研用领域相关专家代表,共同见证新华三多元异构算力平台——H3C UniServer G7系列、下一代AI数据存储平台——H3C UniStor Polaris X20000系列、傲飞算力平台等十余款智算新品的发布,以持续进化的算力产品,助力行业客户加速迈向智能化未来,共同推动AI产业繁荣发展。

01

元脑®服务器第八代算力平台

一机多芯,开放标准促进多元算力生态进化

随着大模型能力的持续提升,生成式人工智能在企业侧、行业侧的落地正在提速,智能应用不断涌现。

日趋丰富的AI应用场景也衍生出新的算力挑战,不同AI应用的典型特征及系统需求存在差异,需要多元的算力生态予以满足。伴随着通用处理器在芯片架构、指令集等方面对AI的优化增强,在AI推理端的巨大应用潜力使得CPU在AI时代变得更加重要,需要系统创新释放通用算力在AI领域的应用价值。

元脑服务器第八代算力平台成为全面且强大算力生态的载体,源于浪潮信息的诸多创新系统架构设计,将通过共建开放标准的方式聚集更多生态力量,使能通用算力与AI算力共同支撑日益多样的AI工作负载,加速多元算力生态进化,推动开放多元算力标准落地。

通用算力领域

浪潮信息积极参与的开放计算模组规范(OCM),正在推动建立基于处理器的标准化算力模组单元,构建CPU的统一算力底座,解决多元CPU生态挑战问题,推动算力产业快速发展。会上发布首款基于服务器计算模组设计规范OCM的NF3290G8,整机全面解耦,以CPU、内存为核心构建最小算力单元,标准化高速/低速互联接口,实现处理器算力模组部件化,灵活支持多类型CPU,让不同算力共享统一平台,降低算力产业创新试错成本和推广适配成本,也让多元化的应用场景能够快速找到贴合的方案。

AI算力领域

浪潮信息推动开放加速规范OAM的生态繁荣,大幅缩减国内外加速芯片和服务器的适配周期,加速先进算力上线部署,支撑大模型及AI应用迭代成熟。目前,90%高端AI芯片基于OAM规范设计。会上发布基于UBB2.0规范开发的元脑服务器NF5898G8,可以兼容符合OCP开放加速规范的多款OAM 2.0模组,通过全模块化的设计及极致的系统能效,满足算力的快速迭代需求,进一步加速算力融合创新。

智能增强,全面加速大模型开发与AI应用创新

元脑服务器第八代算力平台实现了全面的智能增强,通过搭载自研服务器操作系统KOS、AIOps智能运维管理平台以及AI软件堆栈,从服务器智能,到快速构建AI开发环境,到作业调度和资源统一纳管,乃至智算中心智能运维,提供全面的平台软件与工具软件支持。

新平台在预警、散热、管理等方面进行了全新的智能化升级。其中,在智能预警方面,全新升级内存故障智能预警修复技术MUPR,基于对上万台服务器故障数据的建模分析和AI模型算法的训练,实现内存故障提前预警、内存错误实时隔离、内存故障智能修复,降低内存导致宕机故障率80%。在智能管理方面,通过RTOS实时操作系统,实现开机3秒内智能管理调控风扇转速,降低30%的噪音,确保散热安全。

面向大模型部署难题,新平台与服务器操作系统KOS实现软硬协同优化,自研KOS AI定制版简单2步即可实现大模型训练环境搭建,200节点训练集群开发环境,采用AI定制版20分钟即可完成部署上线可用,极大提升了大模型开发部署效率。

技术优势与应用场景

1

性能与能效提升

相比第三代至强处理器,搭载最新英特尔®至强®6处理器的元脑服务器性能提升200%,每单位能耗下性能提升230%以上。这种性能提升不仅体现在处理速度上,还体现在能效比上,为AI、云原生、数据分析等多样化应用场景提供更绿色、更强大的算力支持。

2

广泛的适用性

元脑®服务器第八代新品适用于多种应用场景,包括AI训练、AI推理、通用AI、云计算/虚拟化、大数据、分布式存储、视频转码、数据处理等。其丰富的产品线和灵活的配置选项能够满足不同行业和领域的需求。

02

新华三重磅发布多款智算新品

新华三集团总裁于英涛发表致辞

在AIGC时代,新华三希望带来全新的想法、产品与解决方案:一是聚焦“算力×联接”,充分发挥自身在算力和联接领域,特别是在片间互联和集群互联等方面的核心优势,激发乘数效应,最大限度释放智算资源价值,让算力更澎湃;二是深化“AI in ALL”,持续强化全系列产品的智原生能力,实现全栈软硬件产品、解决方案内嵌AI,打造更便捷高效的客户交互体验,让算力更智能。此外,我们也将秉持开放协同理念,联合各地政府及众多生态伙伴,依托图灵小镇模式成功经验,切实提高智算中心使用效益,满足不同行业、不同规模客户多元的算力需求,助力算力普惠。   ——于英涛紫光股份董事长、新华三集团总裁兼CEO

多元异构算力平台 H3C UniServer G7系列

面向AI的可进化架构

H3C UniServer G7系列服务器采用先进的模块化设计,CPU/GPU/存储等子系统均可随需升级;智流风道、智冷散热、智静网棉、智旋风扇、智敏传感等高效系统设计,完美应对高功耗挑战。新华三践行ALL in Green战略,G7产品家族液冷技术多维进化,助力可持续发展目标;推动智算算力接口标准化,G7新一代AI服务器兼容OAI 2.0标准,已完成和10+家AI芯片厂商的联合设计,共同打造开放生态;业界首款E3.S CXL2.0内存池,降低成本的同时提升数据交换性能,重塑数据中心架构。

内生AI的操作系统和管理中枢

新华三自研数据中心操作系统磐宁OS具有高可靠、强性能、易维护的优势,满足云计算、数据库、大数据、人工智能等业务要求,已广泛应用于金融、政企、运营商等行业;智能管理中枢五大智能再次升级,有效提升运行效率、性能和诊断准确率的同时,大幅降低能耗。   

拥抱AGI的多元算力体系

H3C UniServer R4900 G7是业界唯一支持6张双宽GPU的2U服务器,树立通用服务器新标准,实现对虚拟化、SDS、云计算等场景的全面赋能;AI算力旗舰 H3C UniServer R5500 G7支持万亿参数大模型训练,已覆盖超过15种主流开源大模型的训练;AI训推一体引擎 H3C UniServer R5300 G7可同时搭载8块双宽GPU或16块单宽GPU,拥有广泛的模型兼容性,兼容超过200个主流AI模型;面向万亿模型超节点集群——UniPoD 是目前业界唯一使用PCIe方案的AI超节点,产品实现Scale-up互联规模显著提升,大幅降低延迟,有效提升万亿参数模型训练性能。        

H3C UniStor Polaris X20000系列

性能加速:Polaris X20000系列通过存储软件栈全面重构大幅精简无效IO并优化IO路径,实现单节点80GB/s带宽、200万IOPS优异性能,大规模集群性能近线性增长,满足智算应用海量小文件高性能并发和百TB级带宽需求。

架构简化:Polaris X20000系列面向AI智算多样性数据处理,一个逻辑资源池同时支持文件、对象以及大数据应用,跨协议访问无需转换数据格式,从数据采集到模型训练以及模型分发,在AI大模型训练全流程中数据免搬迁,性能无损,语义无损。

● 极致稳定:Polaris X20000把智算存储平台的可靠性从“数据级可靠”提升至“服务级可靠”。Polaris X20000采用全分布式多活架构,在意外故障的情况下,实现故障秒级切换,计划内扩容与升级时,上层业务无感;支持多租户共享同一存储池,且租户间安全隔离,互不影响,保障智算训练任务不间断连续运营。

傲飞算力平台

AI技术的演进和大模型的兴起带来算力需求呈指数级增长,超大规模算力、超大规模存储、超大规模组网对算力设施建设和超大规模算力调度提出了新的挑战。新华三集团云与计算存储产品线、云与大数据产品线首席产品经理王锋表示,面向AGI时代,高效的算力调度对提升算力资源利用率尤为重要。为应对更加复杂的计算需求,新华三持续进化傲飞算力平台,充分融合十年云原生积累,全面提升有效性、可靠性、稳定性及易用性,以高性能算力基础设施为依托,助力行业客户像用电一样,更普惠、更便捷的使用算力,加速AGI落地。   

结语

元脑®服务器第八代新品以及新华三发布十余款智算新品并建立多元异构算力平台,都是当前智能计算领域的重要进展。这些举措不仅提升了服务器的性能和能效比,还丰富了市场选择,推动了智能计算技术的发展和应用。 (文/宋雨涵)