随着大模型训练和计算能力的迅速增长,国际上以GPT-4为代表的大型模型训练产品热度居高不下,而国内的文心一言也宣布向全社会开放。然而,国内大型模型训练面临高昂的成本及主流核心部件供应不足的限制,从而在替换和迁移方案方面存在较大掣肘。
为了解决上述问题,Intel近期推出了第二代Gaudi深度学习加速器——Habana Gaudi2。Gaudi2以其领先的性价比优势和稳定的供应体系,旨在成为大规模AI部署的更优选择。超云作为国内专业的数据中心产品及服务提供商,紧跟Intel前沿技术,迅速部署产品研发资源,正式推出了基于英特尔AI加速卡的全新产品——AI服务器R8868 G13。
超云R8868 G13
Gaudi2深度学习加速器在第一代Gaudi高性能架构的基础上,在多方面提升了性能和能效比,从而加速了高性能大型语言模型的运行。该加速器具备以下特点:
1、24个可编程的张量处理器核心(TPCs);
2、21个100Gbps(RoCEv2)以太网接口;
3、96GB的HBM2E内存容量;
4、2.4TB/秒的总内存带宽;
5、48MB的片上SRAM;
6、集成了多媒体处理引擎。
Gaudi2在GPT-3的评测中也展示出了其性价比优势:Intel使用了384块Gaudi2加速器,在311分钟内完成了训练,从256个加速器扩展到384个加速器,实现了近线性95%的性能提升。
英特尔发布Gaudi2加速器
一直以来,超云在 AI 算力领域扮演着重要角色,作为国内率先推出基于 Gaudi2 产品方案的厂商之一,超云 AI 服务器 R8868 G13 集成了 8 块 Gaudi2 加速卡 HL-225B,同时可支持 2 颗英特尔®第四代 Xeon EGS 系列处理器。此前,超云连续三年获得”Intel钛金级合作伙伴”荣誉,双方在产品研发和技术突破方面保持着密切合作。本次产品方案的推出不仅是双方紧密合作的有力证明,也充分展示了超云在 AI 领域的实力。
通过有效的产品部署,超云迅速为客户提供了高质量、高性价比的解决方案,成为国内首家推出一体化全栈解决方案的厂商。目前,该方案正在进入测试和收尾阶段,通过这一优质解决方案的复制,超云占据了市场先机,获得了越来越多互联网巨头的关注和认可。
随着大模型在各领域的商业化落地,大语言模型及生成式 AI 的需求不断扩大,市场对高性价比硬件服务器的需求也随之变得更加迫切。基于 Gaudi2 的 R8868 G13 服务器,使超云在性能和性价比方面具备领先优势。
未来,超云对与英特尔的合作充满信心,双方将借助深化合作和技术迭代,提供更高的深度学习性能,进一步帮助客户提升收益价值,加速国内大模型的创新和迭代,推动各行业领域的数字经济发展。