在人工智能蓬勃发展的浪潮下,半导体产业正经历着一场意义深远的变革。Arm发布的《芯片新思维:人工智能时代的新根基》行业报告,为我们深度剖析了这一领域的现状与未来走向。

一、AI驱动下的半导体产业转型
半导体产业正处于关键转型期,这一转型由人工智能崛起和传统摩尔定律放缓共同驱动。正如报告中所指出,“半导体产业正经历一场由人工智能(AI)崛起以及传统摩尔定律放缓所驱动的关键转型”,该报告聚焦于芯片技术如何演进,以满足AI对算力的巨大需求,同时解决能效、安全性与可靠性等关键问题。在AI算力需求的强劲推动下,芯片技术正积极寻求创新方向,努力应对这些复杂挑战。
技术创新替代传统缩放:传统的摩尔定律缩放方法已触及极限,产业开始转向定制芯片、计算子系统(CSS)和芯粒等创新方案,以此提升性能与能效。
能效成为AI计算核心考量:随着AI工作负载对计算需求的不断攀升,能效成为关键因素。芯片设计通过整合优化内存层次结构、采用先进封装技术和成熟的电源管理技术,在维持高性能的同时降低能源消耗。
安全威胁促使防护体系升级:AI技术的发展带来了新的安全威胁,半导体产业构建多层次的软硬件防护体系。从芯片加密技术到AI强化的安全监测系统,全方位应对新兴安全威胁。
芯片设计制造关联更紧密:新的制程工艺节点要求整个生态系统更深入合作,芯片设计与制造之间的界限逐渐模糊。先进封装技术和芯粒设计的发展,成为推动未来创新的关键动力。
软件生态系统至关重要:软件生态系统是释放新芯片架构潜力的关键。确保与AI框架无缝兼容,并为定制芯片提供优化支持,是新型芯片架构普及的关键。
二、洞察行业发展关键议题

在定制芯片设计中,平衡定制化与通用性至关重要。Arm解决方案工程部执行副总裁Kevork Kechichian表示:“定制芯片设计的关键在于确保芯片与软件具备高度的可复用性。虽然每颗芯片都是根据特定需求定制而成,但底层平台必须具备一定的通用性,这正是平台真正的价值所在。这些底层平台需要能够确保不同定制芯片之间实现一定程度的相互复用,唯有如此,才能有效应对成本与产品上市时间所带来的挑战。”
Arm通过识别可复用模块与资源,与SoC及IP提供商合作,为合作伙伴提供定制化解决方案,缩短产品上市周期。
为在降低能耗的同时平衡算力和能效,需从多个层面入手。Kevork Kechichian提到:“要实现这一目标,首先从最底层出发,从晶体管层开始,与晶圆代工厂紧密合作,确保晶体管在功耗和性能方面实现优化,无论是动态功耗还是漏电功耗;再来是架构层面,对CPU以及各类处理引擎的指令集进行针对性优化;然后向上进入整个结构中的更高层级,从系统级芯片(SoC)设计、封装到数据中心等方面进行优化。在此过程中,关键要点在于对数据及其传输过程的保护,降低在内存之间传输数据所消耗的电力;最后,在支撑大型数据中心运行的软件层,实现智能负载均衡,即针对人工智能(AI)的不同方面进行处理上的优化,并合理分配工作负载,尽可能减少不同节点之间的数据传输。”
定制芯片面临开发成本高、资源需求大的问题,包括人力和计算资源。Kevork Kechichian指出:“定制芯片的开发成本非常高,所需的资源也非常大——这既体现在投入开发的人力上,也体现在为开发定制芯片所需的大量计算资源上。”
为此,Arm已探索出多种能够有效降低开发投入的方法。从加快产品上市的角度出发,Arm的定制化解决方案能够让合作伙伴显著缩短其产品上市周期。最基础的方法是从平台的角度出发,识别可复用的模块与资源,并确保定制工作是在已有基础上进行,无需一切从零开始。在生态构建方面,需充分激发各方核心专长,整合产业联盟力量,通过软件复用推动生态系统繁荣。
AI推理运算需要独特的技术开发路径,涉及计算子系统、SoC框架和软件体系。Kevork Kechichian认为:“AI推理运算需要独特的技术开发路径——从计算子系统到SoC框架的专用架构设计,再到实现这一切的软件体系。主要的架构差异在于对带宽和数据传输的关注,这些系统需要针对推理工作负载和高带宽进行优化,以满足不断增长的需求。随着模型训练与推理的发展,云端训练后的模型可在边缘设备运行,提升数据传输效率和整体性能。”
AI推理工作负载与传统计算不同,Arm探索新的底层模型方法提升推理复杂度。Kevork Kechichian介绍道:“AI推理工作负载与传统的纯计算处理有很大不同。显而易见的是,端侧仍需承担一定程度的处理任务,但Arm正在探索一种全新的底层模型方法——该方法能根据用户反馈提升AI推理的复杂度。与此同时,Arm聚焦于异构计算,该范式中的CPU、GPU和TPU能够支持不同的工作负载。上述所有处理器都可以作为AI推理的处理引擎,部署到Arm合作伙伴所开发的SoC中。”
打造可持续的生态系统,关键在于激发和整合各方核心专长。Kevork Kechichian提到:“构建和维护这一生态系统至关重要,实现这一目标的关键在于,我们必须充分激发并整合各方在不同领域的核心专长。”
当前,各类产业联盟正在蓬勃发展,成为推动行业创新发展的重要力量。商业上的收益是参与各方的驱动力。例如,晶圆代工厂关注晶圆销售带来的收入增长,各类IP提供商则聚焦于权利金的增长,这一清晰的商业逻辑贯穿于整个产业链,一直延展到服务提供商,再到仿真平台领域。而在此生态系统中,软件的复用会让参与的各方都能从中获益,共同推动生态系统的繁荣与发展。
芯粒技术发展的关键挑战是设计与接口方式的标准化,涉及封装和系统通信全过程。Kevork Kechichian表示:“在我们当前所处的技术范式中,最关键的是如何对芯粒(chiplet)的设计与接口方式进行标准化。这涉及从封装厂如何集成这些芯粒,一直到在系统中不同芯粒之间进行通信的全过程。因此,与合作伙伴就标准化问题达成共识至关重要。”
在此背景下,Arm推出的芯粒系统架构(Chiplet System Architecture,CSA),旨在对各个芯粒之间及在整个系统内的通信方式等多个方面实现标准化。此外,Arm携手合作伙伴共同推动AMBA CHI芯片到芯片互连协议等倡议的落地实施,确保来自不同供应商的不同芯粒通过一个统一的接口协议来确保芯粒之间的互操作性。
面对AI驱动的网络攻击,Arm构建多层级软硬件防护体系,在芯片中集成加密技术,结合AI强化的安全监测系统抵御威胁。Kevork Kechichian介绍:“当前行业正在加速演进,针对SoC平台IP的攻击手段日趋复杂。Arm正在通过构建多层级的软硬件防护体系,提升防御能力。”
Arm在芯片中直接集成加密技术,并结合经AI强化的安全监测系统,使现代SoC架构能够抵御传统攻击与新兴的威胁。此外,AI本身也正日益成为抵御安全攻击的有力助手。通过基于网络的监测与先进的代码分析,AI驱动的技术能够以人类难以企及的速度和规模识别可疑行为,并发现潜在漏洞。Arm正在最大限度地发挥这一优势。
芯粒设计、先进封装与Arm异构计算架构是未来AI计算的主流路径。Kevork Kechichian谈到:“对海量AI计算的需求正在推动多种技术加速融合。从芯粒技术角度来看,鉴于先进工艺节点所能产出的实际可用晶粒(die)数量有限,行业正转向采用尺寸更便于管控的芯粒技术。同时,将芯片中的不同功能模块进行隔离设计,大大提升了整体的成本效益。一些先进的封装范式实际上正在提升这些芯粒的性能与能效。”
以3D封装为例,当不同的晶粒垂直堆叠在一起,无论是计算晶粒、基底晶粒还是内存晶粒,从处理单元到内存的接口距离都会变得非常短,这不仅显著减少了数据的传输路径,还降低了功耗,并提高了整体性能。最为关键的是,先进封装与芯粒技术的真正价值在于实现真正的标准化。通过标准化,企业可以根据不同的性能需求,快速地组合和配置这些芯粒,从而打造出具有不同性能定位的芯片。这不仅大大缩短了产品上市周期,也能确保在快速迭代的市场竞争中占据先机。
三、行业展望:迎接挑战,拥抱变革
半导体产业正处于关键转折点,AI的发展为芯片技术带来了前所未有的机遇与挑战。行业各方需要紧密合作,IP提供商、晶圆代工厂、系统集成商等应携手应对技术难题。在技术创新方面,持续探索新的架构、材料和集成技术,提升芯片的性能、能效和安全性。同时,注重软件生态系统的建设,确保软件与硬件的协同发展,以释放芯片的最大潜力。
未来,芯片技术将在AI的驱动下不断演进,满足日益增长的计算需求。面对电源供给、热管理、内存带宽和安全等诸多挑战,整个生态系统需积极创新,采用新的工具和方法论,加强协作。正如报告结论所述,“计算的未来,尤其是AI的未来,取决于我们能否持续突破芯片技术的极限”,只有这样,才能在AI时代构建起强大的芯片技术基石,推动计算领域的持续发展,释放AI的变革潜力,同时有效管控计算成本与复杂度,实现半导体产业的可持续发展。