全面满足行业算力需求 GPU成英特尔新的增长引擎

在一部分大众认知里,英特尔重回GPU市场的主要目标是与NVIDIA、AMD在消费领域一较高下。但事实果真如此吗?

重回高性能GPU领域 英特尔的目标不只在消费级市场

2017年,随着图形架构大神Raja Koduri加入,英特尔宣告重回高性能GPU领域的那一刻起,其目标就并不仅仅是指向消费市场。因为对于英特尔而言,核芯显卡的存在使其在PC领域拥有极高的GPU市占率。同时,PC市场的盘子也承载不下英特尔GPU的宏伟愿景。


市场调研机构JPR发布的2Q21GPU市场份额报告显示,英特尔GPU市占率为68.3%
(注:该报告包含了独立GPU、集成型GPU,并非单指显卡)

伴随着边缘计算、5G、AI、云游戏、超清视频流媒体、在线直播、区块链、元宇宙等新兴技术和行业兴起,“计算”这一概念再次被拓宽边界。英特尔希望在一直以来所擅长的CPU与集成型GPU之外,拓展在独立GPU领域的优势,以此来满足这些新兴行业对于算力的渴求。因此,为大众消费市场和这些新兴行业兴起和发展做好准备,并成为驱动这些行业发展的中坚力量,才是英特尔GPU使命所在。

灵活的Xe  图形架构为英特尔GPU带来优异的泛用性

单从架构技术层面就可以看出,英特尔GPU绝不仅仅只是在消费市场一争高下。

英特尔Xe图形架构从研发之初就考虑到了灵活性和泛用性,因此在一种架构下实现了四种不同规格的微架构设计。它同时包含面向集成显卡、入门级独显的Xe LP架构,面向游戏和桌面级图形性能的Xe HPG架构,还包含面向数据中心和AI的Xe HP架构以及面向高性能计算的Xe HPC架构。


一种架构包含多种微架构,进而覆盖不同应用需求

Xe图形架构的出现,正式宣告了英特尔向高性能GPU领域进军的决心,同时也完成了英特尔对Scalar(CPU)、Vector(GPU)、Matrix(ASIC)、Spatial(FPGA)四大计算类型的芯片全覆盖。

全面满足行业对高算力的需求 英特尔GPU宏伟愿景清晰勾勒

产品层面,五年时间里英特尔稳扎稳打步步为营,同样可以看到其不仅仅只是局限于消费级领域,而是以高算力为基础,全面满足新兴行业不断拓展的愿景。

今年3月末,英特尔率先发布锐炫A系列高性能移动端独立GPU。它采用灵活可拓展的Xe HPG微架构设计,包含了强大的AI引擎和增强的媒体引擎,通过全新打造的Xe显示引擎和图形管线来处理各种不同显示任务。同时还支持XeSS超级采样技术,并且是行业首个支持AV1编解码的消费级GPU。锐炫A系列GPU还包含了Deep Link这样的多功能技术集,其中的动态功率共享,超级编码和超级算力三大技术成为锐炫A系列GPU的王牌技术。

除了首发的锐炫移动端之外,英特尔还将在今年年内陆续推出面向台式机和工作站的高性能独立GPU。而锐炫A系列显卡的逐步落地,也是英特尔向消费级高性能GPU领域迈出的又一大步。

但是到此就够了吗?当然不是。

5月,英特尔借着“英特尔On产业创新峰会”,让我们窥见了其面向数据中心的代号为Arctic Sound-M(ATS-M)的高性能GPU的一些细节。它包含两种不同的配置,150W 功率版本在一个3/4长、全高尺寸的 PCIe 4.0 加速卡中封装了 32 个 Xe 内核。75W 功率版本则在半高尺寸的 PCIe 4.0 加速卡中封装了两颗具有 8 个 Xe 内核的 GPU,共 16 个 Xe 内核。这两种配置均配备了 4 个 Xe 媒体引擎、英特尔首款面向数据中心的 AV1 硬件编码器和加速器、GDDR6 内存、光线追踪单元和内置 XMX AI 加速,能够提供每秒150万亿次运算(150 TOPS)能力。

值得一提的是,ATS-M是一款能够真正满足多媒体转码、视觉图形处理和云端推理等企业级生产力场景需求的“多用途GPU”。它由完整的解决方案堆栈支持,为开发者提供了面向流媒体、云游戏和云端推理的开源软件堆栈,并广泛支持 AVC、HEVC、VP9,以及更多 API、框架和最新的编解码器。

面对云游戏的使用场景,无论用户对峰值性能、高密度提出需求,还是期待通过一个平台满足跨智能手机和 PC 游戏的融合云游戏解决方案,ATS-M均可以提供出色的游戏串流体验。针对媒体串流和传输,ATS-M配备的 AV1 硬件编码器,可在不牺牲质量的同时,带来 30% 比特率的提升,并可以实现一卡同时处理多达 8 路 4K 视频流或超过30 路 1080p 视频流。

特别地,针对远程办公所带来的虚拟桌面架构(VDI)的增长,ATS-M还提供了灵活的虚拟 GPU(vGPU)调度策略,让管理员能够单独微调 GPU 上每个虚拟机的运行指令,而目前其他厂商产品仅允许在虚拟机的全局设置中进行调整。针对媒体分析类的工作负载,ATS-M还提供良好的扩展性,为客户提供更高的流密度和更低的成本,具体而言,集成两颗 GPU 的 75W 功率版本 ATS-M 能够在计算和解码能力上实现很好的平衡,且不受媒体限制。

事实上,除了ATS-M之外,英特尔此前多次提及的为Aurora超级计算机项目所打造的Ponte Vecchio GPU同样展现了惊人的图形计算能力。据悉,它包含了多达47个颗不同芯片模块,其中包括16个Xe HPC 架构计算芯片、8个Rambo cache芯片、2个Xe基础芯片、11个EMIB连接芯片、2个Xe Link I/O芯片和8个HBM芯片。其整套芯片包含了惊人的1000亿枚晶体管,规模庞大,能够提供千万亿次级图形算力!

消费市场的锐炫系列、超级计算领域的Ponte Vecchio以及数据中心级的ATS-M均陆续在今年相继交付,这已然将英特尔GPU愿景的轮廓清晰地勾勒出来:在计算多元化、算力需求爆发式增长的大趋势下,英特尔GPU将成为驱动新兴行业发展的算力基石,同时也将成为英特尔自身业务增长的突破点。

高性能GPU成为英特尔新的业务增长点

现如今,消费级GPU市场的应用场景已经成型,不外乎游戏、视频编解码、在线视频流媒体播放等。而要想在固有市场中寻求业务增长,尤其是想要在强大竞争对手面前取得发展,只能“积跬步以行千里”。

而面对算力需求呈几何倍数暴增的云游戏、全堆栈流媒体,以及边缘超级计算、高端车载信息娱乐系统、区块链、元宇宙等新兴领域的挑战,则需要大开大合,借助Ponte Vecchio、ATS-M这样的怪兽级GPU加速生态建设与完善,进而使高性能GPU成为英特尔芯片业务的强力增长点。

其实在英特尔2022年投资者大会上,CEO帕特·基辛格就指出,“英特尔GPU产品将在2022年为公司带来超过10亿美元营收。而作为英特尔新的增长引擎,预计到2026年,GPU相关产品将创造近100亿美元营收。”

对于英特尔而言,从传统芯片公司迈向数据服务型公司时,实现增长就已经注定不再只依赖自身所擅长的CPU。尤其近年来人们对于无处不在的算力的需求,让英特尔更加明确了GPU图形计算能力的重要性,而大幅度的营收规模增长预期,足以看出GPU强劲的“造血能力”对于英特尔自身发展的重要性。

结语

在很多人心目中,英特尔是一家出色的CPU芯片公司,这一点无可厚非,毕竟数十年来英特尔在这个行业都是公认的领军企业。但事实上,英特尔现如今所扮演的角色,则是借助强大的算力提供能力,驱动各行各业发展的基石力量。

就以GPU为例,如果从大众认知角度来看,英特尔所提供的就是锐炬Xe、锐炫A系列这样的传统意义上的图形显卡,它们为大众消费者,为PC用户提供可靠的图形性能支持,满足用户看视频、玩游戏、剪视频的基本应用需求。

但如果从行业角度来看就不仅仅是这么简单了。

一方面,无论是Ponte Vecchio还是ATS-M,亦或是未来Falcon Shores(一款将x86与Xe 显卡集成在同一插槽的全新架构,它将在每瓦性能、计算密度、内存容量与带宽方面均实现超过5倍的性能提升)体系下的全新架构产品,它们可能并不像锐炬Xe、锐炫A系列这样能够描摹出某一个具体的用户画像,但其强大算力却可以为世界上千千万万用户提供更好的体验或服务。

另一方面,伴随着新兴领域、新兴技术不断涌现,越来越庞大的工作负载驱使图形算力需求持续增长。因此,英特尔必须以技术为驱动,以产品为先锋,以生态体系建设与合作为后盾,利用自身在软件、AI、网络、边缘等技术上的优势,与各个产业合作伙伴携手,在为新兴领域不断提供强大算力支持、实现自身增长点突破的同时,驱动新兴行业高速发展,从而使得由算力驱动的、有望改变人类生活方式的新技术、新行业、新领域最终实现落地。