关注感存算一体技术与应用,业界首个相关论坛亮相全球闪存峰会

存算一体技术是最近几年被业界关注的一种新的架构。

2021年7月30日下午,在杭州国际博览中心,堪称中国“首个专门针对存算一体化”进行探讨的 “存算一体化”分论坛在2021全球闪存峰会上成功举行。

2021全球闪存峰会“存算一体化”分论坛

知存科技创始人、CEO王绍迪,作为百易传媒(DOIT)特邀嘉宾和论坛出品人荣誉担纲论坛主持人,并在精彩演讲后主持了一场对话;参与对话的嘉宾有还有来自存算一体领域知名的专家、企业家或创业者:后摩智能联合创始人、战略副总裁项之初,每刻深思CEO邹天琦,犀灵视觉创始人冉亮以及浙江大学卓成教授。

对话嘉宾: 知存科技创始人、CEO王绍迪,后摩智能联合创始人、战略副总裁项之初, 浙江大学卓成教授,每刻深思CEO邹天琦,犀灵视觉创始人冉亮(自左至右)

【以下内容根据速记整理, 未经当事人审定】

主持人:

今天的存算一体论坛,是之前从来没有办过的、专门针对的存算一体为核心或者感存算一体为核心的论坛。希望未来会有越来越多的公司关注并参与到存算一体、感存算一体的领域中来。

主持人:知存科技创始人、CEO王绍迪

目前可以看到,虽然大家都在存算一体赛道中做事情,实际上做的很多内容都是互补的,后摩智能做的云端的存算一体技术,每刻深思首先攻关音频端,犀灵视觉更多集中在视觉传感器方面解决问题。我认为,存算一体有很大的应用市场,也同样可以互补。

存算一体可以解决大算力的数据搬运速度慢的问题,感算一体可以解决传感器和芯片之间数据搬运的问题,借今天这个机会跟大家讨论一些问题。

第一个问题是:未来的存算一体和冯诺伊曼架构,会往哪个方向发展?是存算一体逐步替代冯诺伊曼架构,还是另外一种共生的形式去实现?

后摩智能联合创始人、战略副总裁项之初

项之初:

今天各位都是技术背景,我不是,所以来的时候还很紧张(笑)。从我们的角度,和冯诺伊曼架构下的CPU、GPU应该还是一个共生的关系,不可能马上取代它。即使当存算一体慢慢地具备比较优势,逐渐侵蚀英特尔或者英伟达的市场,最后还是一个共生的关系,因为在AI并行计算领域存算一体有比较大的优势,但在原来的传统领域,如CPU的控制和规划,GPU的图形渲染,它还是要用到原来冯诺伊曼的架构。冯诺伊曼架构从上个世纪产生,有它存在的优势和理由。只不过在AI年代,大家发现它已经不是最优的结构。所以,我觉得还是一个共生的关系。

犀灵视觉创始人冉亮

冉亮:

我觉得不论是存算一体还是冯诺伊曼的架构,大家还是要找到比较符合各自技术的应有场景的痛点。像刚才几位说的,在AI领域,存算并行的运算方式还是可以真实解决客户的一些痛点。当然,存算还是一个比较早期的技术,需要很努力地来证明我们真的要比冯诺伊曼在这方面有优势,才敢谈得上和冯诺伊曼共存,所以路还比较长,大家一起努力。

浙江大学卓成教授

卓成:

首先谢谢王总邀请,这次跟几位业界大咖学到了很多知识,我基本上同意项总的观点。存算可能更多是并行的,定制化、目标很明确的运算。对于通用,没有明确目标的,我们必然还需要传统的冯诺伊曼架构。所以未来的系统肯定是存算、CPU这样的冯诺伊曼架构并生的异构势头,这个是比较明确的趋势。当然随着存算进一步壮大,很有可能未来的CPU会是一个面向存算的CPU,这样二者才会有更好的结合。因为现在CPU和存算是独立开展,CPU不会考虑任何存算的工作。未来我觉得CPU会考虑更多存算需求,为它做定制化。

邹天琦:

非常赞成卓教授的观点。这个学术问题,在卓教授后面作答,我压力山大。我的观点跟前面两位嘉宾非常一致,我认为它是共存也不是共存。共存是什么?

每刻深思CEO邹天琦

我有左手右手,放在一起就是共存,但是我认为它们是共融的关系。在CPU里有一部分特别针对AI的应用,基于存算去做更好。为什么我认为能做这样,包括这个产业能往前推动发展,其实很多时候也是由场景的驱动、市场的需求和痛点所带来的。只有有真实的有待被去解决的问题,才有我们的机会。AI的出现,它本身在场景上就具有容错性。这样的基础之下,我们才能做存算包括做感存算的工作。

所以,我认为冯诺伊曼架构和存算一体在未来是一个共融的关系,他们会更加促进彼此的成长,包括在不同的场景里面去实现交融,达到最好的能效、性能和成本的最优比。

冉亮:

我觉得不论是存算一体还是冯诺伊曼的架构,大家还是要找到比较符合各自技术的应有场景的痛点。像刚才几位说的,在AI领域,存算并行的运算方式还是可以真实解决客户的一些痛点。当然,存算还是一个比较早期的技术,需要很努力地来证明我们真的要比冯诺伊曼在这方面有优势,才敢谈得上和冯诺伊曼共存,所以路还比较长,大家一起努力。

主持人:

刚才大家提的看法,我之前也思考过,我发现大家非常务实,大家做都是从问题出发,在存储器和传感器侧发现数据搬运问题,用存算一体和感算一体解决问题。现在存算一体和感算一体还在初期发展状态,不像GPU、DSP一样成为一种特定应用的通用架构,同样的算力问题,冯诺依曼架构和存算一体都会去解决,早期是竞争。

我认同卓教授讲的,当存算一体和感存算一体逐渐成熟,有一些杀手级应用之后,竞争更多转化为合作。其实我认为这也是未来发展过程中冯诺依曼架构和存算一体越来越能走共生的渠道,互相配合得越来越好。但是未来到底要怎么实现?

所以第二个问题就是,现在感存算一体和存算一体已经发挥出一些潜力,在一些场景中有很大的优势,但是对于未来感存算一体和存算一体的发展,包括未来的算力上,在能效上是否还会继续进步,进步空间有多大?如果要能进步,需要从哪个方面着手?请冉总先谈。

冉亮:

我谈一下我们后续发展的思路。从工艺的角度,大家听的比较多的是从3D封装等方面来解决摩尔定律面临的一些问题。我们也会从这方面做这些工作。即使我们用12寸晶圆,也就是65纳米或者40纳米,其实就可以做一个比较强悍的产品。随着工艺节点再往下,从算力的角度、功耗的角度,我们应该比现在做得更加好。同时,我们应用stack技术的话应该还有很大的机会后续推出更加强悍的存算一体或者感存算一体的方案,这是我们的一个思路。目前,我们现在用到的存储介质有SRAM,我们自己搭的三个管子的DRAM的数字存储器,当然前面还有一些模拟的寄存器。包括忆阻器方面,我们后续也在与国内一些科研团体做前期预研,也在留意更新的存储介质,能否对我们再往更强悍或者更低功耗等方面提供更好性能有拓展的机会。

邹天琦:

冉总说的很对。我觉得从器件层面来讲,其实有很大的进步空间。我们做模拟计算,在存储单元里面用的也是基于Re/SRAM来做的,这是目前看到最能落地的形态。其他的器件类型有自己的独到优势,包括今天的主题是FLASH、RRAM新器件。相信未来等这些器件就绪,跟上下游打通之后,还有非常巨大的优化空间。

从信号的层面,我们做感算也是在持续优化,去打通传感进来的信号或者计算单元的消除,在这方面还可以持续优化。从架构层面,既要做到存算,解决数据转化接口的问题,同时又要解决计算的问题。两个是不同层面的问题,所以需要在架构上不断优化和创新,从顶层的算法到架构、到电路进行联合的设计和优化。

我相信这个路很长,就像刚刚冉总说的,但是这里面有非常有价值的东西有待于挖掘,不只是可以做到3-5年,我相信它可以做5年做10年,可以一直做下去。

卓成:

非常同意冉总和邹总说的。我认为存算和感存算是新生事物,新生就有很多不成熟,有很多改进的空间。在工艺这边,现在没有给存算单独给工艺,未来工艺上一旦改进,本身就有收益了,邹总所说的新器件,铁电、忆阻器等等也是这样。存算、感存算本身就是一种架构上的革新,感存算是三件事情,取消了中间的接口,把它们放在一起从而获得能效提升。现在这方面已经做了很多,但是还不够好,可以进一步更深做融合,架构本身也会带来许多能效、性能上的提升。在集成方式方面,刚才冉总提到了3D架构,还有一些演示或者产品出来。

最后一点我想提的是系统方面的革新,现在软件层面也还没有针对存算的各种软件,无论是编译器还是更上层的算法优化。这方面,如果有专门的存算编译和算法优化,可能会带来量子的革新,这一点非常重要。

项之初:

我很同意三位嘉宾的观点。从后摩的角度,我们可能还是会往下走,本身算力和能效比都会提升。比如说到12纳米甚至7纳米,会往更小的走。而基于RRAM、MRAM这些先进的存储如果成熟的话,也会让我们显著地提升算力和能效。

团队的工程能力是很重要的。英伟达有上万人的工程师团队,做了20年,它不断地打补丁不断做产品优化。我们团队虽然也有做过从0.18微米到6纳米芯片,也有从AMD、海思等大厂过来的资深工程师,但还需要打磨。我希望我们是从上百TOPS做起,慢慢做到先进存储的芯片。

主持人:

几位嘉宾也说了,我们的问题是未来怎么发展,大家都提到一点,就是当前在存算一体和感存算一体发展的初期都遇到很多不成熟的问题,包括工艺的不支持、系统的不支持、软件的不支撑、工程化团队的不支撑,其实我认为这也是作为初创企业尤其在先进技术早期研发阶段遇到的种种困难。但英伟达在早期做CUDA的时候也是顶着巨大压力,但之后我们都看到CUDA给他们带来非常大的收益。

所以第三个问题是,在存算一体或者感存算一体早期商业化落地的时候,大家认为哪一点更重要?或者解决哪一点问题上,可以帮助存算一体、感存算一体快速落地,从而有现金流支持自己未来做技术研发,把存算一体、感存算一体做到英伟达这样的规模?

卓成:

这个问题应该由业界大佬先讲,我这边是自己的学术想法。从我的认识来看,首先是应用。存算需要找到非它不可的应用,或者说我做了存算的系统,不只是存算芯片本身,存算系统相比其他的系统有一个数量级的优势,那么市场才会买单。市场变大了,存算才会有比较好的前景。

邹天琦:

我刚刚举了车的例子,发明油车到电车,其实忽略了在这个过程中以日本人为首做了油电混合的车。从场景的应用,、节能、包括驾驶的感受,我认为油电混合是最好的一种产品形态。但为什么我们国家推电车?不单单是技术层面的问题。延伸到我们现在做的事情也是一样,无论是我们做存算一体还是感存算一体,它都是基于模拟计算做的。但是我认为真正最好的产品形态给到客户那里的是数模混合,混合才是未来。

所以在整个的产品定义,包括市场的推广当中,其实我们首先是从客户的需求,包括功能、接口,包括里面的模块和数据流的角度去考虑里面有那些具体的功能是否更好地可以用存算或者感存算完成,有哪些是可以更好地用数字做。因为很多时候给客户增加一个模块、一块芯片,增加的成本很难让人买单。最好的方式是本身在设备里面有两三块芯片集成用一块芯片做,我用数模混合把两三块芯片做在一起,同时成本更低。这样的情况下,可以更好说服客户。

如果只有一个维度的优势,比如功耗的优势,虽然可以把功耗干到极低,只有1/10,但从客户的角度来讲依然很难,因为他要考虑的一些变量其实更多了。作为商业,成本是占比很大的因素。所以,如何构建自己的壁垒,我认为要从多个变量维度做,不只是功耗,包括延时,包括成本,包括客户的易用程度,就是刚刚说的编译器、软件的问题。这些东西都做好了,放在一起,基于存算或者感存算打造的才是一个在市场上有竞争力的产品。这是我的一点看法。

冉亮:

就我们和客户打交道的经验来看,在新技术落地的时候,还是要找到客户非常痛的点。我们就是紧紧抓住超低功耗以及超低延时,让客户通过一颗普通图像传感器和一颗边缘AI解决不了的这些点,然后将这样的痛点能够充分地打穿他,再往后我们就可以在面上进行展开。这样的话,可能是我们在初创的过程中的一个机会。

我们要和一些传统大咖公司做竞争,在资源、资金和人上面都不具备优势,所以我们就先单点突破,然后再从面上进行落地。这是我们现在考虑的一个策略。

不管从感存算或者存算,我们还有一个优势,就是从成本来考虑。比如说要达到同样水平的性能,就是我们所需要的工艺节点与传统架构的工艺节点相比,还是有优势。打个比方,别人是7纳米做的事情,我们可能20纳米就可以把它替代。这样的话,从成本角度对客户来说也是有非常好的吸引力,虽然说用新技术有蛮多的风险,甚至有易用性等问题,但是从成本出发还是能说服客户用我们全新的技术。

项之初:

前面几位都讲得特别好,我补充一句。我们希望看到的商业场景,比如我刚刚讲的泛机器人、无人配送等,我看北京也有一些无人车配送,不单是测试牌照,已经给了运营牌照,在限定区域内可以送,如果想让它更快推广,需要更大算力。当这一类的机器人需要更大算力的时候,对功耗又极其敏感,其实这是我们觉得对于存算一体包括感存算一体都是一个极好的落地方向。这是我的想法。

主持人:

刚才各位介绍的时候也都说到了感存算一体落地的时候,实际上不仅仅是自己优势的一点,还需要很多其他的场景或者客户的需求,或者其他的产品的配合。

最后一个问题,因为我们之前都在关注存算一体和感存算一体,其实大家在看未来5-10年的发展,除了存算一体的发展,其他的技术也在发展,有没有其他的技术能够和存算结合在一起,一起打造共生或者一起打造革命性的产品?

邹天琦:

我的认知比较有限,首先感存算一体这个东西还有很长路要走,其他的新技术又挺多的,包括比较时髦的脑机接口,我认为比较有趣。量子计算,可以在特定领域用好。

主持人:

可以跟你的技术一起打造革命性的产品或者应用场景?

邹天琦:

我想从另一个维度说这一点。跟很多新的场景结合,这是存算包括感存算非常有优势的一点。因为我们能带来的功耗的下降、延时的降低以及成本节省,就是用成熟的工艺去做,带来成本的降低,这是革命性的,意味着我们可以让原来一些不可能的功能、原来不可能的场景变为可能。大家看我们用的手机,十年以前用的是砖机,而现在有很多新的功能都是从当年的不可能变为可能,这是算力的提高、能效的提高所带来的。未来大家都讲AR/VR很多概念,由很多基本的基础设施搭建,比如说我要真正实现SmartWorld,不是说我要与信息的世界隔绝开来不去触摸物理世界,活在我自己的宇宙里面,这不是SmartWorld。真正的SmartWorld是物理世界和新兴世界的打通,是两个世界的共融。要做到这一点,就需要在物理世界具有很好的感知的基础设施,有大量的传感器,基于这些传感器感知整个物理世界周边环境的一切,同时把这些信息提取出来,比如说基于项总的大算力的场景,更好地把它和在新兴世界基于AR/VR或者其他脑机设备所看到的一些进行融合。所以这些东西的打通,需要很多技术的支持和支撑,包括显示技术、电池技术、感存算,也包括新的材料的创新。所以我认为这些新的技术在一起,它能实现新的场景和新的功能,从不可能变为可能,这是最让我有吸引力的一点。

我们还是专注于把我们的一小块做好,万丈高楼平地起,做好了,以后的真正的更美好的世界才能呈现在我们面前。

主持人:

邹总讲的非常好,不知道后面的嘉宾压力大不大。冉总接着讲一讲?

冉亮:

我觉得清华大学团队的立意都非常高,比较难超过。邹总说的让生活更美好,其实许多场景因为受限于硬件或者说技术的瓶颈,其实业界可以有许多的应用场景。但因为目前技术的瓶颈解决不了,所以可能不一定能够往那个方向去发展。

前段时间我看了一个美国的团队做了一个非常好的让生活更美好的例子,就是许多弱视的人群或者视力很差的人群的电子眼的技术,也是类似图像传感器上做一定的运算。但是要放在眼球上的话,功耗要求更加极致。通过一定的模拟运算,对采集到的周边环境的信息做一定的增强或者说特征的提取,然后给弱视的人来增强他的视力。在之前如果没有模拟预算的技术和传感器结合在一起,人们就无解,没有比较好的技术来满足这些用户的需求。随着这样的技术可以提供,人们可以让不同的应用或者说更新更有趣更有用的技术可以落地,这是充分发挥技术特点可以做的事情。

对于一些新的技术,为了要和国际大咖去竞争,其实我们没有其他的路,只有走得比他们更快、更前面,可能才会有机会。所以,大家可能更需要做一些创新性的早期的科研,特别是让从高校出来的科研成果早日落地。

我们现在在做感存算产品和应用的1到N的事情,也在看三年后公司要往哪方面做,包括刚才提到的忆阻器,也是我们在研究的事情,同时刚才说的并行运算的好处。因为我们主要是视觉,和光打交道,我们也在关注光子的运算,就是光进来之后不转成电信号,直接对光进运算,这也是利用光的并行运算的优势等等,这方面也都是我们在看的。

项之初:

我们围绕无人车和泛机器人需要大算力的边缘端,去设想未来的场景。如何让他们变得更好,进步得更快。

比如说家庭的服务机器人。原来大家说入口是智能音箱,后来发现音响不能运动,这不是入口。后来大家说扫地机器人可能是入口,因为它能动,它可以给你视觉,它可能有以后可以端茶送水。比如现在国内外很贵的机器人,Boston Dynamics,我们把它分为感知、大脑和肢体的部分,如果把肢体部分做得越来越好、灵活,成本可以越来越低,低到以一个家庭服务人的形式出现,你一定需要一个很聪明的大脑,这个大脑就是算力。

算力一定需要很低的功耗,不能是一个像AlphaGo那样下盘棋要2万瓦,那就没法普及,国家都会说你不符合碳中和和碳达峰的需求。所以,这是我们希望黑科技做到的一点。当然,刚才邹总的脑洞开的很有意思,就是如果SmartWorld或者AR/VR把真实世界虚拟化,虚拟和真实融合在一起,传感器在现实生活中会到处都是,它可以模拟出线下的世界,这同样需要很大的算力。

总结一点,只要能摄取更多的数据,能用这些数据让交通更好,让大家生活得更便捷,就需要更大的算力,同时对功耗极其敏感,那就是我们这些公司的机会。谢谢!

卓成:

我觉得几位老总讲的很好,而且都讲得让我心血澎湃。

我自己的理解,一个方面可能是像之前冉总谈到的铁电新型器件的成熟,这些相比CMOS本身在存算方面有其优势所在。现在很多时候因为它的良率或者集成度的问题,所以没有办法做商业化产品。如果这个能成熟,我觉得存算本身来说肯定是很大推力。

另一方面,我也很同意几位说的一个好的应用场景,很多时候硬件的变革不是硬件推出来的,而是上面的应用驱动出来的,如果AR出来一些很重要的算法或者一个很有希望的算法,它反过头来会驱动硬件的革命,这就是存算和感存算的机会。

主持人:

刚才四位嘉宾总结了很多,我从中间学习到挺多新的应用场景,这跟我过去几年做公司时候的感受是一样的。我的感受就是我早期做公司的时候,最开始我只看到很有限的需求,2016年时候亚马逊的智能音箱用AI。之后每年我都会接触到新的需求,对算力或者能效有更高的需求,或者当前的技术无法支撑。每年新的需求会比之前的需求高两三倍算力。我们不清楚未来会有什么新的需求。但是看起来对于AI算力的需求是越来越高,就像现在的数据中心。

感谢今天四位国内存算和感算一体顶尖企业代表以及知名学者来参会,希望明年可以有更多的企业代表和学术领袖来参加论坛。

最后,非常感谢各位嘉宾和来宾能够在疫情期间克服困难来到这次会议。谢谢大家!