本周,英伟达宣布推出其首款用于AI和HPC服务器,基于Arm的Grace处理器,尽管业界有所察觉,但其首次亮相仍对AMD和英特尔的股价产生了负面影响。
毫无疑问,英伟达是一个强大的竞争对手,但英特尔认为,它并没有真正威胁到其数据中心业务。
英特尔新任首席执行官,Pat Gelsinger在受访时称:“我们上周发布了Ice Lake (冰湖处理器)系列处理器,并获得了积极响应。在Ice Lake上,我们对AI功能进行了扩展。英伟达正在回应我们,而非我们对此做出反应。显而易见,这种AI增强型CPU的想法是英特尔发挥巨大领导作用的领域。”
英伟达发布适用于AI和HPC的Grace处理器有望在AI和HPC工作负载方面比x86处理器速度快10倍以上,但它会在2023年初发布。像这样的性能看起来总是非常强大,不过AMD和英特尔的竞争并没有停滞不前。
英特尔最新的至强处理器以DL Boost(深度学习加速)的名义集成了AI加速技术,该技术目前包括在AVX512_VNNI(Cascade Lake和Ice Lake)和AVX512_BF16(仅Cooper Lake)等指令集扩展。
据英特尔测试显示,两者都极具竞争力,并且在处理优化算法时,它们可以让英特尔的CPU性能比英伟达的GPU高出15倍。
此外,由于英特尔的至强CPU被广泛用于推理型工作负载,并且ISV(独立软件开发商)为这些处理器优化了他们的引擎。简而言之,英特尔的至强可扩展产品已经有AI增强功能,其后续产品自然会扩展AI功能。
通常,Arm,AMD,英特尔和英伟达等公司都在努力提高其处理器(CPU,GPU,IPU,VPU等)在AI和HPC工作负载中的性能以应对人工智能的需求。超级计算正在迅速发展。与过去的30年相比,未来几年AI和HPC方向将取得更大进步。
需要注意的是,英伟达当前展示的Grace CPU是与GPU集成,而非独立存在。因此,虽然Grace处理器本身可能具有众多AI增强器,但英伟达会把它和针对计算优化的数据中心GPU一起打包出售提供一个处理AI和HPC工作负载的平台。
2022年,英特尔也会拥有一个类似的平台。英特尔的第四代至强可扩展Sapphire Rapid处理器(有多达56个内核)以及针对各种工作负载的众多增强功能,明年将与英特尔千亿晶体管的Ponte Vecchio计算GPU一起在Aurora 百亿级超级计算机中使用。
这款GPU似乎有约1 FP16 PFLOPS性能,或1,000 TFLOPS FP16性能,是英伟达 A100的312 FP16 TFLOPS性能的三倍。