宝存科技徐伟谈 3D Nand闪存趋势与挑战

6月30日,主题为“关键之年,让闪存绽放”的2016中国闪存峰会在北京举行,来自产业界的众多嘉宾围绕闪存技术本身将如何演变与发展等热点问题 进行了精彩的分享。在上午主会场中,上海宝存信息科技有限公司技术总监徐伟发表了《3D Nand闪存趋势与挑战》的主题演讲。

大家好!我是上海宝存信息科技有限公司的徐伟,借此机会给大家介绍目前半导体行业,闪存行业跟我们制造商面临的挑战,包括目前2D闪存的发展情况、遇到的问题、3D闪存的现状以及它的发展状况,简单分析闪存定义的数据中心应用情况,推出基于3D Nand Flash将会是以后数据中心的主流选择。

12

讲Flash制造工艺的时候不得不提制程,就是两个最小的功能单元之间的距离。

从十年前,大概是50纳米的水平进入到去年最新的工艺,也是目前主流的工艺15纳米。其实它的驱动力就是成本,成本下降才有可能带来大规模的应用。闪存的介质在90年代初就有,利用我们现在的话来说,这是属于在军方的黑科技。到零几年的时候,当我们知道闪存可以制作固态硬盘的时候也没有多少人可以用得起。20年中,闪存的成本其实是下降5万倍之多,相对GDP增长来说,它的倍数依然很高,结果就是闪存的应用成本下降非常快,很快就黑科技转变为有可能使用的东西,以及到现在大规模的进入数据中心使用。flash制作工艺上目前是使用2D Nand,Nand使用的工艺最新,第一条线是CPU制作工艺,达到了30纳米的水平,第二条是DRAM,目前的工艺处在20纳米的水平。商用没有那么长时间,Nand现在接近10纳米的支撑,已经接近物理极限。再往下做的话,它的可靠性非常堪忧,目前没有能够突破。相对制造成本来讲,从工艺的升级带来成本下降,开始会很快。但是在到达20纳米的时候,我们称之为EX纳米级别的时候,成本下降变的非常频繁。

我们常说闪存的基本介质,SLC、MLC,在容器内如何识别定位?如果有和没有是两种,我们可以定义为0和1,这样区别是比较粗糙的,但是也是比较容易实现的。后来发现可以更加精准地区分定位的时候,我们可以把它分成四份,这样就是MLC,目的是什么?目的是在同样的介质里面,我们能够存储更多的数据,相对SLC来讲,MLC能够存储的比特就会直接的翻倍。当然它的驱动力还是成本,目前2D Nand接近10纳米遭遇的严重挑战,中学有概念是万有引力,两个物体有重量距离不近我们认为没有关系。距离近的时候会产生干涉,我们用于电子的容器,当它们的距离达到10纳米的级别,一个容器里面电子的活动就会对另外一个临界的容器里面的电子产生影响。我对一个单元进行擦洗,不可能不会影响旁边的数据,我们称之为干涉。到这个级别的时候,目前的工艺还没有办法能够很好地突破干涉。

我们想了办法,我们从原来平面的结构把它竖起来,在晶圆上可以放下更多的叠层。这涉及到成本的问题,因为在3D的Nand上做叠层,3D Nand的情况下使用的晶圆是可以少一些的。如果说纯粹地对2D Nand,它的成本不会下降。

目前3D Nand使用的制程是40纳米,如果从刚才的图来看这是属于10年前的制程技术,尽管在低的制程工艺情况下,它仍然可以做到等效于10纳米以下2D Nand的成本。3D Nand出现以后,我们从成本下降平缓的点,又迎来了另外一个拐点,有了3D Nand以后,我们可以让成本下降的曲线斜率再次增大。2D Nand的容量最大是128G,3D Nand出现了以后我们很快非常轻松地可以达到256G,一年之内有预期的应该是可以达到单个芯片512G的容量,就是两个指甲盖的面积可以做这么大的容量。

3D Nand是堆叠层,堆的层数越多,成本可以分摊的厉害,如果说堆十层成本会变成1/10。但是大家都知道,我不可能通过简单地堆叠就可以获得成本的线性降低,或者说指数级的降低。因为最终如果说您的层数足够多的话,一定会又遇到工艺的问题。叠层到达一定的程度,这个成本会到达一定的拐点。目前3D Nand我们的样品在48的叠层,叠层到达100层左右的时候才会出现成本的拐点。因此,目前3D Nand在到达拐点之前还会有非常多的进步空间,有足够的时间让我们达到这个平衡点,并且突破这个平衡点。

单位面积上,3D Nand相对2D Nand,可以做到2倍以上的容量增加,这是我们供应商给我们的数据。3D Nand大家肯定会想工艺改变了,密度增大了,可靠性如何审视?可靠性有增强的地方。我们使用的工艺制程技术是10年前的40纳米的技术,有这样的距离存在单元与单元之间的干涉就可能不是问题,因为我们现在已经能够处理15纳米级别的干涉问题,40纳米就不是问题。所以它们之间从这点来讲,因为间距的增大,3D Nand的可靠性会有增强。

另外,原来我们锁住电子或者操作,现在我们使用了Charge Trapping。我们实际得到的结果是横线的部分,在2D时代是虚线的部分。使用新的机理以后可以更加容易区分电位的区别,相邻的电位之间重叠的部分更小,我们可以更好地区分。这样在KLC或者说以后的QLC,区分8个和16个暗电位,它们的细节是非常细微的。

3D Nand会遭遇挑战,提到闪存的时候有一个概念数据可保持性。充进去多少电子形成电位,电位在我一段时间以后再过来读,它有没有变化,是不是还是原来的数据,这是有可能有变化的。电子在3D Nand上多了一个维度的泄漏方式,在数据的可保持性上有一点挑战。但是控制器会解决这个问题。失效的可能性多了一部分,原来在平面上我们只有一个维度的失效的可能,但是在3D的维度上我们有平面和竖直方向两个失效的可能。因此,使用3D Nand对控制器的要求更高,但是现在控制器的生产水平其实已经考虑到了这一点。比如说我们有更强的ECC的能力,我们可以使用更先进的解码技术。

除此之外,我们在SSD的制造商,我们在各个芯片之间可以使用RAID,更好地RAID,可靠性更高的RAID解决数据一致性的问题,解决部分的产品和部分的元件失效的问题。写入方式上,我们尝试不同的编程方式,能够对这样大的载体实现更高速度的解读。

目前数据中心跟闪存的关系,数据中心偏向于云化,云化最后会产生两类主流的应用。一类是数据库,一类是虚拟化。这两种业务都有着非常强的随机化的特性,对虚拟化来讲我的存储承载的是所有的虚拟机,每一个虚拟机的业务不一样,它的IO模型也是不一样的。我收到所有虚拟机发过来的IO请求,这会非常的复杂。底层来看这是完全随机的IO形式,在机械硬盘时代,其实机械硬盘应该是通过转盘片摇磁臂读取数据的,在应对随机读写的请求下会非常吃力。在闪存的时代不存在这个问题,基本上在闪存时代的话顺序和随机是一样的效率。闪存可以提供系统在存储路径更低的延迟,延迟在目前可能是我们在系统优化中最重要的一点。

没有考虑延迟之前,系统优化基本上只有一个方法,通过并行来优化。但是并行的优化可以找到极限的,这是阿姆达定律。如果解决一个性能,我们使它的性能翻倍,我们想追求等式左边的S足够大,我们可以估算出我们做并行优化可以达到什么样的提升。右边的曲线是几个取值,右边的参数P代表可被优化的负载在总负载的百分比,S就是并行的数量。我们可以看到如果一个系统它可以被优化的负载占50%,其实在这个系统的可被优化的空间已经非常大。如果有50%的负载可以被并行优化,哪怕是上到几千的并行,它优化的极限只有2倍,就是最下面的曲线。除非可以被优化的负载可以达到95%,可以通过特别高的并发在最后达到极限20倍的提升。在并行优化黔驴技穷的情况下,如何缩短路径的时间,延迟是系统优化的方向,闪存在这方面有得天独厚的优势。

3D Nand在企业级的应用中会成为未来的趋势,我们目前使用48层的叠层,大家可以认为48层是一个拐点,可以和2D的Nand进行PK,叠层高于48层,它的成本一定比2D的低。目前达到成本的拐点,这是在100叠层左右,3D Nand成本优化空间非常巨大。3D Nand可以做TLC,可以做出更多的容量。基于3D Nand企业级的SSD,包括宝存在内的厂商都在尝试,明年3D Nand是闪存厂商使用的主要介质。TLC和MLC,市场刚刚出现SSD的时候,可能我们所说的单元都是SLC,但是现在没有人提SLC,因为成本和容量都不能上去。SLC当时大家都认为这是消费级的应用,不可能应用到企业级的市场,随着控制器的水平和SSD厂商组织部件的能力,我们已经可以把当时认为不靠谱的MLC做成现在的主流企业级的应用介质。TLC相对MLC目前就是处于之前一个类似的情况,比如说去年苹果6开卖的时候,很多人会心里不高兴,说查了一下我的这个上面买的Nand闪存是TLC,我认为这是不靠谱的。但是没有听说因为谁拿到了一个TLC的苹果,它的数据存储出现了问题,因为存储的比特多了,看起来可靠性降低,但是实际上起企业级的应用有办法把这样的介质组织成企业级的产品。TLC会成为企业级的应用,而存储16个比特的QLC会走入消费级的市场。到时候可能买一个1PB容量的手机,这有可能会变成市场的主流选择。

作为制造厂商,基于3D Nand我们会更新我们的产品线,对我们的旗舰产品6.4T,一个季度以后我们可以轻松做到12.8T,在明年我们可以做出单卡容量25T以上的产品。总结一下今天跟大家分享的内容,2D的MLC是主流的解决方案,但是它的工艺和成本已经到达极限,目前的工艺没有办法优化。所以3D Nand的出现解决了这一尴尬的问题,可以提供等效于小于10纳米的制程技术,提高更大的容量,然后有更高的容量,更高的密度,为未来的大容量存储提供可能性。数据库和虚拟化的利用,它的IO模型特别适合闪存的应用,闪存将会成为数据中心以后解决IO问题的主流方法。2016年起,3D Nand会逐渐进入数据中心,在2017年将会成为主流的解决方案。作为消费者来讲,作为企业来讲,将会获得更高性能的,更大容量的企业级产品,最终降低自己的运维成本,降低自己在硬件上的投入。

谢谢大家。

(作者徐伟系宝存科技技术总监,根据录音整理,未经本人审定)