在最近的MLCommons组织公布的MLPerf训练v3.1基准测试中,第四代英特尔至强可扩展处理器又有优异表现。
第四代英特尔至强可扩展处理器内置了英特尔高级矩阵扩展(英特尔AMX)加速引擎,是此次MLPerf测试中唯一提交结果的CPU。
这一次,英特尔提交了ResNet50、RetinaNet、BERT和DLRM dcnv2的测试结果。
在DLRM dcnv2这一新测试模型中,第四代英特尔至强可扩展处理器仅使用四个节点耗时227分钟就完成了训练。
在用ResNet50、RetinaNet和BERT等模型做测试时,即使没做任何调优,也有不错的性能表现。
今年英特尔多次参与了类似的基准测试,基于第四代英特尔至强可扩展处理器的测试结果表明,在处理包括视觉、语言处理、语音和音频翻译模型,以及DLRM v2和大型语言模型等通用AI工作负载时,表现出色。
第四代英特尔至强可扩展处理器提供了开箱即用的功能,使得企业能够在通用系统上部署AI,进行数据预处理、模型训练和部署。
这款处理器支持多个框架和端到端数据科学工具,以及智能解决方案生态系统,不需要面对使用GPU系统时要处理的高昂成本和复杂性。
此外,第四代至强可扩展处理器广泛应用于多个领域。
例如,在百度智能云发布的新一代云服务器BCC实例中,它通过AMX加速器提高了AI算力。在腾讯和阿里云的服务中,该处理器也实现了性能提升。
同时,它还帮助亚信、用友、金蝶和东软等ISV在OCR等领域升级了多项业务,成功应对多样化的AI工作负载需求。