存算一体化的核心优势:以极低功耗处理更多数据

经典的冯诺依曼计算体系将存储和运算架构分离,日常需要让数据在存储器和CPU之间来会搬运,有专家在许多年前就预言了冯诺依曼架构的瓶颈。

核心理由是:当数据越来越多,数据搬运的通道就会显得更狭窄,而且搬运过程中需要较大的能耗,这为算力和能效提升带来了不可逾越的障碍。

冯诺依曼架构系统有80%的功耗发生在数据传输上,99%的时间消耗在存储读写过程,最终,真正用于计算的能耗和时间其实占比都很低。

当一些新兴应用崛起,特别是需要对大量数据进行大量计算的人工智能兴起以后,需要对大量数据进行搬运,算力不足,能效过低的问题越发凸显。

如果能减少数据搬运,把存储和计算融合到一起,用存储单元去做计算,这一问题便在最大程度上得到解决。

存内计算(PIM-Processing In Memory)/存算一体让存储器件具备了计算能力,由于计算过程不需要让数据在存储器和CPU之间来回移动,从而大大提升计算效率,大大降低计算功耗。

虽然它无法承载过于复杂的计算类型,但是非常适合用在机器学习场景。随着机器学习的兴起,存内计算得到了更多关注,特别是凭借高效率的优势,在边缘AI计算领域非常有前景。

存算一体技术可以数十倍甚至百倍地提高人工智能运算效率,降低成本,近几年来,国内有一大批存算一体技术公司受到了更多关注,比如Myhtic、知存科技、九天睿芯、杭州智芯科、后摩智能、苹芯科技等。

在2021年7月举办的2021全球闪存峰会上,举办了中国“首个专门针对存算一体化”的专题论坛,论坛邀请了知存科技创始人、CEO王绍迪,后摩智能联合创始人、战略副总裁项之初,每刻深思CEO邹天琦,犀灵视觉创始人冉亮以及浙江大学卓成教授,共同深入探讨了存算一体化相关话题。

存算一体和冯诺伊曼架构的关系?

项之初认为,存算一体和冯诺依曼架构是共生关系,存算一体不可能马上取代冯诺依曼架构。存算一体AI领域有比较大的优势,但在原来的传统领域还是要用冯诺伊曼的架构。

冉亮也表示,存算一体目前还是一个比较早期的技术,需要很努力地来证明真的要比冯诺依曼架构更有优势,才能谈得上和冯诺依曼共存。

卓成教授认为,随着存算一体化的进一步壮大,未来CPU会面向存算做优化,CPU会考虑存算的工作,未来CPU会考虑更多存算需求,为它做定制化。

存算一体化的算力和能效比的进步空间有多大?

冉亮:随着工艺节点的发展会有一定的进步空间,此外,一些新技术也会加强存算一体化方案,同时会留意新介质的优势。

邹天琦:器件层面有很大的进步空间,同时,要在从信号的层面持续优化,架构层面,既要做到存算,解决数据转化接口的问题,同时又要解决计算的问题。

卓成教授提到了系统方面的革新,现在软件层面也还没有针对存算一体化的各种软件,如果有专门的存算编译和算法优化,可能会带来大的革新。

存算一体的早期商业化落地,哪一点更重要?

邹天琦用油电混合的车类比于数模混合的存算一体化方案,在落地过程中,将两三块芯片集成用一块芯片来做,成本更低,用户的接受程度也更高,还需要考虑易用程度。

冉亮认为要强调超低功耗以及超低延时的优势,用存算一体化解决普通图像传感器和一颗边缘AI解决不了的问题。

存算一体能与哪些技术相结合,一起打造革命性的产品?

邹天琦表示看好脑机接口和量子计算的发展前景。发挥存算一体化在功耗下降、延时降低以及成本节省方面的优势,一定可以做一些原来做不到的事情。

冉亮分享了传感器具备运算能力后的一个使用场景,它能用来帮助弱视的人群提供电子眼,由于需要放在人眼眼球上,所以,需要存算一体化技术的低功耗优势。

项之初也强调了低功耗的意义。如果都像AlphaGo那样下盘棋要2万瓦电力,机器学习技术就没法普及,如果AI系统具有低功耗优势,就能摄取和利用更多数据,让数据智能还改善人们的生活。

结束语

在强调绿色节能,强调碳达峰碳中和的背景下,在数据快速涌现的时代下,存算一体化高效率处理数据的能力非常令人向往。

延续了多年的冯诺依曼架构本质上也是追求用更低的功耗处理更多工作任务,而存算一体化则是在用截然不同的策略加速这一进程,期待存算一体化技术取得更多进展,也期待技术应用上能有更多突破。