西安紫光国芯左丰国:以存储系统结构创新突破存储墙
算力和存力虽然也在不断提升,但是比不过数据爆炸式增长的速度,于是便出现了不平衡的现象,这被叫做 “存储墙”。提起存储墙这个问题,其实行业里的朋友都很清楚,它是一个由来已久的问题。从上个世纪80年代开始,处理器的性能基本上是按照每1.5年两倍的速度向前演进……
8月29日,西安紫光国芯半导体股份有限公司(以下简称“西安紫光国芯”)副总裁左丰国在杭州开元名都大酒店召开的以“芯存储 AI未来”为主题的2023闪存峰会上,发表“以存储系统结构创新突破存储墙”的演讲,以及西安紫光国芯在相关技术领域的储备和突破。
以下内容根据演讲速记整理。
左丰国:各位嘉宾,各位行业的朋友,非常荣幸接受邀请来参加FMW会议。我是来自西安紫光国芯的左丰国。西安紫光国芯是一家以DRAM技术为核心的产品和服务提供商。
今天我分享的题目是“用存储系统结构创新突破存储墙”。
提起存储墙这个问题,其实行业里的朋友都很清楚,它是一个由来已久的问题。从上个世纪80年代开始,处理器的性能基本上是按照每1.5年两倍的速度向前演进,而存储系统则是按照每10年两倍的速度向前演进,最终出现的性能鸿沟表现为“存储墙”问题。
今天,面对大数据大算力需求的情况下,仅仅谈CPU处理器的算力显然是不够的。我们已经进入了一个大算力的时代,在过去的几年里,我们每个人都见证了大模型数规模从千万级别到千亿级别的惊人增长。同时也都感受了ChatGPT这个超级怪物的强大实力,它反映出的是大模型的落地。近年来,大模型带来的算力需求是以每两年750倍惊人的速度向前发展。作为当前全世界算力芯片担当的NVIDIA公司,因为算力爆炸性需求也在创造一个又一个历史,它的市值在2020年首次超过了Intel,今年二季营收135亿美元,更是首次单季营收超Intel。
可以说,算力时代带来了太多意外和惊喜。
回到“存储墙”话题。事实上,在大算力时代,存储墙问题比以往任何时候都要凸显。这个图上列了两个存储基础图,上面讲了HBM的发展趋势,下面讲的是GDDR的发展趋势。可以看出,从2014年之后,算力芯片已经切入到HBM赛道上,随后HBM芯片一路飙升,今天HBM3已经进入量产,但是头部厂商依然觉得HBM3无法满足需求。所以大家已经开始讨论HBM3E,说明在大算力时代存储系统依然是算力系统拖后退的“人”,“存储墙”问题依然很突出。
今天,我从两个点分享自己关于突破“存储墙”的思考。
在芯片级,3D嵌入式DRAM技术是一个非常有潜力的技术。回顾一下GPU系统存储方案的演进,左边的图可以看到典型的板级系统,十年前GPU系统都是典型的平面结构,GPU芯片和GDDR芯片之间通过毫米级的连接进行数据传输。2014年HBM器件进入人们的视野,本质上是2.5D封装技术进入到算力芯片领域。它的连接距离达到微米级别。按照这个趋势,采用3D异质集成嵌入式技术在实现提升存储性能方面有极大的帮助,可为算力系统提供上百TB级别的带宽,同时在能效比、延迟上好于2.5D结构的。整个存储系统在结构上,完成了从平面的2D到2.5D再到3D面的演进。
西安紫光国芯提供成熟的三维异质集成嵌入式DRAM技术,可以提供数十到数百TB的超大带宽,同时也是一种超低延迟、超低功耗的存储方案。
目前西安紫光国芯在该技术上已经做了比较多的积累,研发了三代产品。这三代产品不是替换关系,而是针对不同的细分领域。
第一代是实现一层逻辑和一层DRAM的堆叠;第二代实现一层逻辑和两层DRAM的堆叠;今年推出的第三代产品实现了多层逻辑和多层的DRAM堆叠。这三代结构被证明对于目前的大算力芯片在解决带宽问题方面是非常好的对策。在设计的时候需要在代码集成阶段、在后端实现的阶段把相应的IP集成进去,随后关键点在于在拿到逻辑晶圆的时候做一个3D的堆叠,完成之后多张晶圆变成形式上的单张晶圆,再去做CP测试、封装。这是在工程上非常容易实现的方案。
接下来分享的是从系统级对于突破存储墙的思考。CXL技术本身一个开放性的互联标准,是Intel在2019年提出来的技术方案,随后得到了行业上下游大厂的支持。从本质上讲CXL技术其实是为了解决处理器和设备之间如何实现存储数据高速访问的办法,发展比较快,2019年提出来第一版,2022年第三版都已经推出了。
从技术上,CXL设计的初衷有三个方面,一是实现智能网卡、加速卡的接口的形式存在;二是作为内存一致性的接口存在;三是把CXL协议作为存储模组或者器件的接口使用,这是在各个场景中跑的比较快的应用。用CXL type 3器件来实现内存的容量扩展、带宽扩展。
CXL Type3如何实现内存带宽的扩展?这个图是一个典型的2DPC的方案,CPU旁边还有8个X8的CXL接口,如果在这个方案里面把2DPC改成1DPC,插上另外的一组CXL,内存容量保持不变但带宽增加了。如果在现有的接口上插上CXL的设备,发现容量和带宽均实现了拓展。
目前CXL Type3在设备接口和物理形态上已经基本定型,比如接口物理层采用PCIe 5或6,物理形态上推荐度最高的是E3.S 1T或2T的形态。
西安紫光国芯是国内比较早关注这个技术的公司,在2019年联盟开放扩容的时候第一时间加入了,并非常紧密的跟随技术向前走,参与了标准和技术的讨论。基于前面的积累,也发布了自己相关产品的路线图,形成了自身CXL技术上的积累。
西安紫光国芯历史比较久,前身为成立于2004年德国英飞凌西安研发中心的存储事业部,2015年加入到紫光集团,是以DRAM(动态随机存取存储器)技术为核心的产品和服务提供商。作为以科技创新为驱动的综合性集成电路设计企业,核心业务包括标准存储芯片,模组和系统产品,嵌入式DRAM和存储控制芯片,以及专用集成电路设计开发服务。
凭借领先的科技研发能力、丰富的设计测试量产经验、完善的产品开发流程和严谨的质量管理体系,公司研发的DRAM存储系列产品实现了包括DRAM KGD、DRAM颗粒、模组产品的全系列、全种类覆盖,填补了国内存储器领域多项高端产品的空白。同时,公司成功开发超大带宽、超低功耗、超大容量嵌入式DRAM,多款搭载该技术的高性能SoC芯片产品已实现大规模量产和销售。
紫光集团创建于1988年,是具有全球竞争力的领先智能科技产业集团,拥有覆盖芯片半导体、信息通信基础设施、云服务和数字化解决方案的广泛产业布局,致力于成为数字经济时代科技创新的中坚力量,推动智能科技全产业链生态体系建设。
这是我报告的所有内容,谢谢大家!
【编注:由DOIT传媒主办、杭州华澜微电子股份有限公司协办,以“芯存储 AI未来”为主题的2023闪存峰会,由杭州市萧山区人民政府、萧山经济技术开发区管理委员会指导,中国计算机学会信息存储专委会、中国计算机行业协会信息存储与安全专委会、武汉光电国家研究中心、浙江省半导体行业协会等单位支持。】