【算力大盘点】2024半导体芯片市场的深度探索之旅——“不同架构芯片的市场格局,谁将引领计算未来?”

 引言

半导体芯片行业,作为现代电子技术不可或缺的基石,其产业链覆盖了从精密设计、精细制造到严谨封装测试的每一个环节,构筑起了一座座科技的高塔。在人工智能、物联网、5G通信等前沿技术的浪潮推动下,半导体芯片的需求如同潮水般汹涌澎湃,不断催生着行业的技术革新与产业升级。

今天,我们将为您开启一场半导体芯片市场的深度探索之旅。从CPU、GPU到AI芯片,我们将全面剖析整体市场的风云变幻;从英特尔、AMD、英伟达到高通,我们将细致解读重点企业的辉煌与挑战。

此外,我们还将目光投向未来,为您揭示国产算力崛起、异构计算兴起、不同架构芯片市场格局的演变,以及各大企业在2024年的产品迭代新动向。

文字编辑| 宋雨涵

1

整体市场情况

CPU市场

根据Jon Peddie Research公司的报告,2024年第三季度全球CPU出货量实现了显著增长,与第二季度相比增长了12%,同比增长了7.8%。这一增长趋势在客户端CPU市场和服务器CPU市场均有所体现。特别是中国市场的强劲表现,推动了PC CPU出货量的大幅增长。具体来看,2024年第三季度PC CPU市场的整体增长率达到了12.2%,总出货量从第二季度的约6000万台上升至约7000万台。在细分市场方面,笔记本电脑CPU的份额从第二季度的24%上升至30%,而台式机CPU的份额则保持在约70%。

GPU市场

Jon Peddie Research发布的GPU市场报告显示,2024年全球GPU市场的规模将超过985亿美元。AI和高效能运算(HPC)GPU的年销售量虽然只有数百万个,但由于其高昂的售价,为英伟达和AMD等厂商带来了可观的收入。特别是在2024年上半年,英伟达销售了价值近420亿美元的AI和HPC GPU,全年其运算GPU的销售额可能超过900亿美元。此外,Yole的预测显示,从2023年到2029年,GPU市场的复合年增长率为25%,显著高于CPU的5%和APU的8%。

AI芯片市场

Gartner预测,2024年全球AI芯片市场规模将增加33%,达到713亿美元,2025年有望进一步增长29%,达到920亿美元。AI芯片需求的暴涨,使得先进封装产能成为AI芯片出货的瓶颈之一。台积电、日月光、安靠等厂商均表示先进封装产能紧张,相关订单需求旺盛。英伟达、AMD等公司在AI芯片市场表现出色,特别是英伟达的数据中心业务受益于AI需求的增长,实现了爆发式增长。

2

英伟达与AMD:半导体领域的‘双雄争霸’

英伟达核心芯片技术

Blackwell架构

晶体管数量:Blackwell架构的GPU拥有高达2080亿个晶体管,确保了芯片具有极高的计算能力和复杂性。

制程工艺:采用台积电4纳米(4nm)工艺制造,提高了芯片的集成度,降低了功耗和发热量,实现了更高的能效比。

内存配置:配备192GB的HBM3E显存,提供高达8TB/s的带宽,极大地提升了芯片的数据处理能力和效率。

计算能力:单芯片AI性能高达20 PetaFLOPS(每秒20万亿次浮点运算),比上代产品显著提升了算力。

通信能力:支持10TB/s的片间互联,使得多个GPU能够高效地协同工作,共同处理大型任务。第五代NVLink技术为每个GPU提供了1.8TB/s的双向吞吐量,确保了最复杂的大型语言模型(LLM)之间多达576个GPU之间的无缝高速通信。

多芯片封装(MCM)设计

Blackwell是英伟达首个采用MCM设计的GPU,集成了两个GPU在一个芯片上,增强了并行处理能力和计算密度。

计算引擎

第二代Transformer引擎:结合了Blackwell Tensor Core技术和TensorRT-LLM以及NeMo Megatron框架中的英伟达先进动态范围管理算法,支持4位浮点AI推理,提供了双倍的算力和更大的模型支持。

微张量扩展与动态范围管理:通过微张量扩展和集成到TensorRT-LLM及NeMo Megatron框架的先进动态范围管理算法,Blackwell GPU在保持高精度的同时,实现了性能和模型大小的显著提升。

AMD核心芯片技术

在Hot Chips 2024大会上,AMD展示了其最新一代的处理器架构Zen 5。Zen 5是AMD一系列Zen架构的最新成员,旨在提高核心性能、能效和灵活性:

其设计目标是优化分支预测器、提高指令解码效率,以及增强整数和浮点运算单元。与Zen 4相比,Zen 5进一步优化了缓存层次结构,包括更大的L1数据缓存和更高效的负载使用特性。而且Zen 5在性能上有所提高,在相同性能下的功耗更低。在游戏性能、实时计算和图形处理方面具有优势,有望在高性能计算领域占据一席之地。

Zen 5c核心:AMD还推出了Zen 5c核心,专门针对低功耗应用场景进行了优化。Zen 5c核心具有更低的缓存和时钟频率,进一步增强了能效表现。

在联想Tech World上,英特尔和AMD宣布组建x86生态系统咨询小组。英特尔CEO帕特·基辛格表示,x86正在蓬勃发展,作为几十年来计算基础的X86架构即将经历一个定制化、扩大化和可拓展化的时期,这正是人工智能带来的机遇。AMD董事长兼CEO苏姿丰发言称,AMD和英特尔联合所有创始成员建立x86生态系统咨询小组,将加速计算能力的发展

相关文章链接

【深度观察】跨世纪联手!英特尔终于坐不住了,与AMD携手成立x86生态系统顾问小组,对ARM进行“围剿”

3

英特尔最新芯片技术

IEEE国际电子器件会议

在2024年IEEE国际电子器件会议(IEDM 2024)上,英特尔展示了其在芯片封装和互连技术方面的多项重大突破:

先进封装技术:英特尔介绍了一种名为选择性层转移(Selective Layer Transfer,SLT)的先进封装解决方案。这项技术通过异构集成的方式,使芯片间的封装吞吐量提升高达100倍。SLT技术的基本原理是采用晶圆到晶圆连接的方式,显著提高了生产效率,并允许更高密度的集成。

互连技术:英特尔展示了创新的减成法钌互连技术(Subtractive Ruthenium Interconnect),这一技术通过减少线间电容来提升芯片互连性能,可以在间距小于或等于25nm的情况下实现高达25%的电容降低。

英特尔按下AI PC加速键

作为移动PC的新主角,英特尔酷睿Ultra 200V系列处理器拥有极具突破性的x86能效,在图形性能、应用兼容性、安全性和AI计算能力上都有卓越表现,CPU、NPU和GPU的整体平台AI算力高达120 TOPS,并且实现近20小时的离电续航,远超传统的笔记本电脑。

相关文章链接

【深度观察】英特尔AI PC生态大会:携50位伙伴、30台机型、28个应用,按下AI PC加速键

4

专注PE端的高通

高通旗下的骁龙8 Gen4手机处理器在2024年备受瞩目:

核心架构:骁龙8 Gen4首次采用高通自研的Oryon核心,相比ARM架构具有更大的自主性和后续优化上的轻松性。

工艺技术:骁龙8 Gen4首次采用台积电的3nm工艺技术,标志着安卓智能手机正式跨入3nm技术时代。

性能表现:骁龙8 Gen4的CPU目标频率达到4.26GHz,跑分数据超过天玑9400。在3DMark Wild Life压力测试中,高通骁龙8 Gen4的跑分成绩比对手苹果M2高出了10%左右。

国产半导体的最新进展

壁仞科技:

壁仞科技发布了首款通用GPU芯片BR100,该芯片创下了全球算力纪录,16位浮点算力达到1000T以上,8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别。

BR100采用了壁仞科技自主原创的壁立仞架构,以数据流为中心,对数据流进行深度优化,解决了数据搬移的瓶颈和并行度不足的问题。BR100还采用了Chiplet设计理念,突破了光罩尺寸对单芯片面积的限制,集成了更多的算力和通用性逻辑。

寒武纪:

寒武纪已推出的产品体系覆盖了云端、边缘端的智能芯片及其加速卡、训练整机、处理器IP及软件,可满足云、边、端不同规模的人工智能计算需求。

以思元370芯片为例,该芯片基于7nm制程工艺,是寒武纪首款采用chiplet(芯粒)技术的AI芯片,集成了390亿个晶体管,最大算力高达256TOPS(INT8),是寒武纪第二代产品思元270算力的2倍。

思元370还是国内第一款公开发布支持LPDDR5内存的云端AI芯片,内存带宽是上一代产品的3倍,访存能效达GDDR6的1.5倍。

搭载MLU-Link™多芯互联技术,在分布式训练或推理任务中为多颗思元370芯片提供高效协同能力。

全新升级的寒武纪基础软件平台,新增推理加速引擎MagicMind,实现训推一体,大幅提升了开发部署的效率,降低用户的学习成本、开发成本和运营成本。

海光信息:

海光信息成功研发出更符合本土需求的高安全、高性能、高通用的C86开放架构体系和产品,实现了从引进到自主创新的华丽转身。海光CPU具有优异的系统架构、高可靠性和高安全性、丰富的软硬件生态等优势。其CPU产品线包括面向不同应用场景的3000系列、5000系列和7000系列。

海光DCU深算系列是目前国内唯一能支持全精度浮点数据计算能力的加速芯片,性能可对标国际主流产品。在强大的通用计算性能基础上,海光DCU打造出自主开放的完整软件栈,包括DTK(DCU Toolkit)、开发工具链、模型仓库等,完全兼容CUDA等环境和生态。

海光信息在CPU内部集成了安全处理器(PSP)和密码协处理器(CCP),同时还采用了密码指令集加速、密钥管理和HCT等技术,提升了设备的安全性。

此外龙芯中科的产品体系:包括龙芯1号、龙芯2号、龙芯3号等处理器及配套芯片,以及基础软硬件解决方案。还进行了自主AI芯片研发:在面向推理的AI芯片研发方面取得了一定进展,探索CPU+GPGPU的解决方案在人工智能领域的应用。

龙芯中科:

龙芯中科是中国自主设计芯片的重要企业,其在GPU和AI推理加速领域持续创新。龙芯中科即将迎来其新一代GPU——9A1000的流片。该GPU的设计初衷是为了与龙芯的CPU形成良好的配合,并降低系统整体成本。作为入门级显卡,其性能对标AMD的RX 550,特别适合那些对显卡需求相对较低的应用场景,如基础的图形处理和轻量级的AI推理。

9A1000的开发利用了更先进的工艺技术,预计在性能和成本上都将优于市场上同类的产品。随着未来9A2000和9A3000的研发,龙芯中科的GPU产品线将逐步扩张,使其在细分市场上具备更强的竞争力。

结语

半导体芯片市场近年来迎来了飞速发展的浪潮,尤其是在CPU、GPU以及AI芯片等前沿领域,取得了令人瞩目的成就。各大企业竞相加大研发投入,不断推陈出新,一系列创新产品如雨后春笋般涌现。展望未来,随着国产算力水平的持续提升、异构计算技术的广泛普及,以及不同架构芯片市场格局的不断演变,半导体芯片市场无疑将开启更为广阔的发展新天地。与此同时,各大企业也将持续加大产品迭代和技术创新的步伐,以更加昂扬的姿态应对激烈的市场竞争,精准满足市场的多元化需求,共创半导体芯片行业的辉煌未来。