软硬件协同优化,平头哥玄铁RISC-V斩获MLPerf四项第一

4月7日,全球权威AI基准测试MLPerf发布最新榜单,在聚焦低功耗、高能效的IoT领域Tiny v0.7榜单中,基于平头哥玄铁RISC-V C906处理器的软硬件联合优化方案,取得了全部4个指标的第一。这意味着在AIoT领域,RISC-V架构能以极低的计算代价实现定制化AI功能。

image.png

(图说:MLPerf网站截图)

MLPerf Tiny是目前全球IoT领域对软硬件性能和优化能力测试的权威AI榜单,包含视觉唤醒、图像分类、语音唤醒及异常监测等4个典型AI任务。今年,参与比拼的CPU覆盖ARM、RISC-V及自研架构等。

此次Tiny v0.7榜单中,在不使用加速器的情况下,阿里基于平头哥玄铁RISC-V C906处理器提交的软硬件性能优化结果,在满足精度要求的同时,刷新了全部4个benchmark指标的纪录,创造了RISC-V架构在AI基准测试的最好成绩。

image.png

(图说:权威AI榜单MLPerf Tiny V0.7性能数据对比)

依靠阿里在算法、编译、硬件的软硬一体创新,平头哥玄铁RISC-V处理器实现了AIoT领域的性能优化。

算法层面,阿里云震旦异构加速平台利用架构感知的模型优化工具SinianML,通过压缩、网络结构搜索、蒸馏、弹性伸缩等优化,使得AI推理实现了计算效率的大幅提升。同时,结合达摩院在语音和视觉AI算法方面的领域知识,在具体任务上通过算法优化实现加速。

在编译及硬件层面,基于业界最早量产的向量扩展RISC-V指令集的玄铁C906处理器,平头哥进一步优化神经网络模型部署工具集HHB及加速库CSI-NN2,将AI算子更好地与硬件适配,使得玄铁CPU实现了性能升级。HHB及CSI-NN2均已开源。

据了解,玄铁RISC-V处理器覆盖低功耗、高能效、高性能等各类场景,并支持多个操作系统,广泛应用于智能家电、车载、工业控制、边缘计算等领域。此前平头哥曾开源4款量产RISC-V处理器IP,以及基于玄铁的全栈软件及工具。

“RISC-V架构更灵活,更能满足AIoT时代定制化需求。此次在MLPerf Tiny榜单中取得4项第一,证明了RISC-V在性能及能效方面非常优异的潜力。平头哥将继续推动RISC-V软硬技术融合创新,持续贡献RISC-V生态,让RISC-V成长为更多场景和行业的新选择。”平头哥副总裁孟建熠说。