Arm 2023全面计算解决方案发布,两位数性能的提升昭示不断扩大的市场

2022年,智能手机已成为流媒体的主要设备。

根据移动应用&手游情报平台Sensor Tower发布的数据,2022年全球手游市场营收为788亿美元,虽有下滑,但仍比2019年收入高25%。预计今年全球手游收入重回上升通道,2027年这一数字将突破920亿美元。

2022年,移动应用创造了超过4300亿美元的营收。Arm中国区业务全球副总裁邹挺指出,市场旺盛增长,对更高性能、更加智能以及更多视觉和触觉交互的需求持续飙升。这也带来了比以往更大甚至更加复杂的计算需求。

也是在2022年,Arm宣布推出2022全面计算解决方案(TCS22),提供不同级别的性能、效率和可扩展性,以完善各类终端市场的用户体验。

Arm高级副总裁兼终端事业部总经理 Chris Bergey (右)与Arm 中国区业务全球副总裁邹挺共同发布Arm 2023全面计算解决方案

我们创建了基础计算平台,使数字生活方式成为可能;我们与更广泛的生态系统密切合作,让每一代设备的创新都更上一层楼。Arm正是这些体验的核心。”邹挺说。

从TCS22到TCS23:Arm全面计算解决方案再升级

Arm全面计算战略,是通过一整套针对特定工作负载而设计和优化的IP作为一个完整的系统支持客户无缝协同的工作。TCS22问世一年来,已经为一系列工作负载提供了更高的计算性能和能效,并在多个设备中实现了全面计算战略的所有要素:

——基于TCS22的高通第二代骁龙8移动平台实现了高阶连接计算的新水平,为包括三星、小米、一加、vivo、华硕和红魔等众多品牌的创新智能手机提供动力;

——Immortalis旗舰GPU产品为市场提供非凡的视觉体验。Immortalis是Arm首款基于硬件光线追踪技术的移动GPU,可以显著优化安卓游戏体验。无论是在《原神》中实现更引人入胜的沉浸式故事情节,还是为腾讯新发布的游戏引擎带来60fps甚至更高的帧率,光线追踪技术正在为手游玩家提供令人惊叹的视觉体验;

——与MediaTek合作,其基于TCS22的天玑9200移动芯片组在高跑分的OPPO、vivo智能手机以及其他即将上市的设备中搭载使用。

一年过去,Arm发布2023全面计算解决方案(TCS23)。据介绍,TCS23在设计时充分考虑了智能手机的需求:旗舰级的Arm Immortalis GPU带来最佳的视觉体验,全新的Armv9 CPU集群延续了Arm在智能AI的领先性能地位,各种新的提升和优化,使Arm开发者能够更容易地访问软件。

同TCS22一样,TCS23将以上元素全部结合在全新的全面计算解决方案中,为整个系统的关键工作负载带来了显著提升。

邹挺欣喜地表示,“这是我们为智能手机推出性能最优异的移动计算平台。”

一起来看看TCS23的创新的改进。

解析第五代Arm GPU架构

首当其冲的是GPU。Arm GPU出色的性能、全天候的电池续航时间为视觉计算在捕捉、创造和使用方面的最佳体验提供关键支持。

第五代Arm GPU架构

此次发布的第五代GPU架构,因为引入延迟顶点着色(Deferred Vertex Shading,DVS)功能而重新定义了GPU中的图形数据流,显著减少了内存带宽,总体系统效率与功耗优化高达14%,为相同的功率预算下提供更出色的视觉效果,或者在节省功耗的情况下提供更持久的沉浸式移动体验,成为未来图形和几何复杂工作负载的关键,并具备扩展到更高性能水平的潜力。

全新的GPU架构使下一代游戏和实时3D应用成为可能,并让复杂的PC端和游戏主机体验在移动设备上实现。

设想一下:当建筑师终于在现场直接通过建筑物实时3D效果图将CAD规划变为现实的时候,他们将为甩掉不堪重负的高端设计平台有多么兴奋!

首款基于第五代架构的GPU芯片家族

基于第五代GPU架构,Arm此次发布了Immortalis-G720以及Mali-G720和Mali-G620。

专为旗舰智能手机而设计的Immortalis-G720,是Arm目前性能和能效表现最为出色的GPU。与上一代产品相比,其性能和能效分别提高了15%,系统级效率更跃升了40%,带来更高质量的图形渲染,实现更身临其境的视觉感受。

Arm目前性能和能效表现最为出色的GPU Arm Immortalis-G720

在相同配置下,Immortalis-G720相较基于第四代Valhall架构的前一代产品面积仅增加2%。但值得关注的是,前一代产品在面积效率方面胜出相近竞品高达20%,这是已经得到了验证的事实。

Arm Mali-G720和Mali-G620则是以优异的GPU功能和特性和更低的价位带来了媲美旗舰级的优势。

Armv9 Cortex计算集群

Cortex计算集群因为连续三年两位数性能提升吸引眼球。

作为Arm高性能集群的关键组成,Cortex-X4性能比上一代产品提高了15%,功耗降低40%以上,其面积仅增加了10%。作为Cortex-X系列处理器中每平方毫米性能最出类拔萃的产品,Cortex-X4为包括3A级游戏、全天候生产力和后台任务在内的用例提供强劲支持,特别地,面向下一代人工智能和机器学习的应用也成为可能。

大核处理器Cortex-A720是业界主流的CPU IP,可提高持续性能,是新CPU集群的核心主力;而小核Cortex-A520是Arm出众的高效性能核心。二者均比上一代产品的能效提高了20%。

DSU-120专门为满足高要求的多线程用例设计,支持从可穿戴设备到智能手机、笔记本电脑的众多设备,为用户提供所需的性能和能效,成为CPU集群家族的有效补充。

新的集群提供更多的多核心管理系统单元(DynamIQ Shared Unit,DSU)电源模式,以支持更高效地使用更大的L3缓存,并减少外部DRAM流量,从而实现性能更佳、效率更高的片上系统(SoC)。

与顶级伙伴紧密合作,融合先进制程与计算能力

TCS23的研发悉心听取了合作伙伴的反馈。如在采用Armv9处理器设计的新版CoreLink CI-700中引入创新技术,进一步缩小了芯片面积,互连产生的延迟降低了25%,同时还优化了空闲电源,在不影响电池续航时间的前提下实现杰出的系统性能表现。

为支持未来的节点过渡,Arm正在将先进的制程和计算能力更加紧密地结合起来,实现兼具出色性能与高效的设计。例如,与TSMC紧密合作,推出更加优异的解决方案。今年早些时候,双方在TSMC N3E制程工艺上顺利完成了首个Cortex-X4的流片,共同打造定制的Arm IP,为充分利用制程工艺和处理器带来的性能,功率和面积(PPA)优势做好准备。未来双方还将通过设计分区和利用先进的封装技术,一同协作提高系统性能和能效,构筑起面向未来的更加稳固的生态系统。

新一代CPU和GPU IP产品,在端到端的系统优化和整合后,将实现更出色的移动体验,为当下和以后的移动用例解锁了优异的整体SoC性能。

助力数百万开发者释放创造潜力

基于Arm架构的高性能、高能效计算为智能手机体验所需要的计算能力提供强有力和丰富的支持,是其业内引起了广泛关注的原因;而为开发者充分释放创造潜力,为现代工作负载充分发挥设计才能,则是Arm 全面计算解决方案的一部分。

目前,全球近900万个移动开发者正专注于Arm架构及应用进行开发,为大众提供熟悉和喜爱的沉浸式体验——从高端游戏到区域性应用,Arm为编写更便利、更简单、更安全、更快速的软件提供了所需的灵活性和通用性。

持续创新以面向未来市场

为了满足定义未来计算的复杂需求,并确保开发者能够轻松地在Arm架构的平台上无缝开发,Arm计算平台的能力极限不断突破。

1.完全转向64位

经过多年努力,Arm架构向64位迁移的任务已经成功完成,实现了以64位计算性能支持安全创新,以抵御更先进的数字威胁,并提供可扩展的解决方案,为更广泛的市场带来更多高级的功能。

由是,这些成就去年都陆续得以实现:Pixel 7纯64位应用程序的操作系统、被多款高端手机采用的MediaTek首款全64位的安卓SoC。据中国主流应用商店近期报告称,在前3000款常用的应用中,纯64位系统应用的合规性接近百分之百。

2.提升安全性

数字化时代,数据暴露的风险也在水涨船高。Arm不断研究数字安全对策,内存标记扩展(MTE)功能,支持开发者在应用部署前后检测和避免内存安全漏洞,为用户提供功能安全及信息安全的数字体验。基于Armv9架构的CPU所提供的MTE功能,已经消除70%的内存安全漏洞,在企业和消费者市场得到了广泛的部署和应用。

从全面计算解决方案的创新升级不难看出,Arm始终站在技术前沿,通过不断提升硬件的机器学习功能,让开发者能充分利用AI和ML工作负载的优势,面向更多的消费级与企业级时市场提供服务。

“业内对Arm高性能、高效计算的关注达到新高度,我们也必将一如既往、不遗余力地提供优异的基础计算平台。”邹挺最后说。