从大连工厂看英特尔存储业务的当下与未来

生产一块SSD到底需要多长时间?作为市场化程度较高的商品,为什么SSD的价格也会受供货量影响,出现震荡?涨价后,SSD厂商是否能在最短的时间内提高产能?前不久,DOIT在英特尔大连工厂解了SSD生产过程中的一些秘密,也看到了英特尔存储业务的当下与未来。

生产一块SSD需要多久?

如今的NAND SSD大都是基于多层的NAND芯片打造,3D NAND从2013年开始走进人们的视野,随着制作工艺的快速发展,从32层到64层只用了短短的两三年时间,如今96层的NAND也越来越多了,今年英特尔发布的QLC SSD 665p采用的就是96层的NAND。

然而,伴随着工艺的提升,SSD的制作周期也越来越长了。

以英特尔目前还未发布的144层NAND为例,它将由多个NAND deck组装在一起,这对于微观世界里的NAND架构来说,无论是对技术的精密程度,还是工期而言要求都相对较高。那么,生产一块SSD需要多久呢?

据英特尔中国区非易失性存储方案事业部战略业务拓展经理Benny Ni介绍,一块SSD从无到有需要四到五个月时间,再经过两周的封装测试后,才可以进入市场。

这也就意味着,SSD的价格波动大概只能持续四到五个月的时间。

如果要发布一款采用新技术、新工艺的全新SSD的话,从晶圆到SSD的周期会更长。

比如,英特尔大连工厂在2018年9月就宣布投产了96层3D NAND存储芯片,而采用96层NAND的665p在2019年11月才发布,经过了一年多时间,但这可能已经是现阶段能达到的最快速度。

英特尔大连工厂是英特尔3D NAND SSD的主要生产基地,也是英特尔非常先进的晶圆厂之一,其生产速度应该处于世界领先水平。

英特尔大连工厂是英特尔自1992年在爱尔兰建立F10晶圆厂后新建的第一座晶圆厂,也是英特尔在亚洲的第一个晶圆制造工厂(除美国本土外,英特尔只在爱尔兰和以色列有晶圆厂),总投资25亿美金,目前主要负责生产NAND芯片,未来可能还将负责生产3D Xpoint(英特尔傲腾使用的介质)非易失性存储芯片。

2015年,英特尔宣布投资55亿美元(这是英特尔迄今在中国最大的单笔投资),将大连工厂升级为英特尔 “非易失性存储”制造工厂,本次投资项目使大连工厂一举成为英特尔非易失性存储器产品在集成电路全球制造网络中使用300毫米晶圆中目前技术最先进的生产中心之一。

整体来看,这不仅是英特尔在技术上十分先进的一个晶圆厂,也是英特尔非常倚重的一个晶圆厂。

英特尔中国晶圆厂的与众不同

​2019年11月下旬,DOIT记者有幸去到了传说中的英特尔大连工厂。据了解,英特尔大连工厂有1.5万平方米的洁净空间,参观区洁净空间里的人并不多,远远看过去,只有三三两两全副武装的工作人员在其中走动,远处还摆放着一些机器(可能就有光刻机),头顶上方一台台忙碌的小机器人拿着晶圆正在天花板上快速穿梭,这里消耗的晶圆大都变成了SSD NAND颗粒。

英特尔非易失性存储方案事业部副总裁、英特尔大连存储技术与制造基地总经理梁志权曾在很多不同地区和晶圆厂工作过,从梁志权的介绍中,能感觉到中国的这个晶圆厂还是很了不起的,尤其在执行力和办事效率上最令人印象深刻。

英特尔大连工厂于2007年开始建设,2010年开始生产晶圆,2012年就得到了英特尔内部最高的团体奖项——英特尔质量金奖,表彰其在质量控制上的表现,这点与英特尔大连工厂在纪律性上的卓越表现有很大关系。

此前,当大连工厂开始投产的时候,英特尔派了很多人去美国亚利桑那州的工厂学习,学成归来后,生产同样产品的大连工厂各种质量参数都比美国亚利桑那州的工厂还要好。为了搞清楚为什么“徒弟”比“师傅”做的还好,美国亚利桑那州工厂又反过来派人到大连工厂学习。

类似的事情不止于此,美国亚利桑那州工厂的人发现,英特尔大连工厂的员工会更重视按照要求来操作生产流程,纪律性非常高。

不仅质量管理水平高,英特尔大连工厂建厂的速度,扩大产能的操作也很快。在2015年开始生产3D NAND颗粒,2017年市场上3D NAND出现供不应求的局面后,工厂很快就新建了Fab68A晶圆厂。

作为一个现代化的晶圆厂,大连工厂内部自动化生产程度非常高。此前,英特尔与美光合作紧密,工厂里用的是美光研发的自动化生产管理软件,硬件部分是英特尔的,联合开发的3D Xpoint推出后不久,两家宣布分手。

然而使用由美光研发的软件便意味着英特尔的生产线随时可以被控制,基于此,在英特尔员工的合力研发下,原本可能需要两三年时间来切换的系统,英特尔大连工厂最终只用了两三个月。当所有人以为生产线要停滞两三周时,英特尔大连工厂最终做到了零关闭。

对于资金投入巨大的晶圆厂产线来说,质量水平和生产时间都异常重要,每强化一点带来的收益是非常巨大的,而英特尔大连工厂在执行力和纪律性上非常有优势,这也是英特尔大连工厂的独特之处。

英特尔存储发展战略与落地布局

英特尔大连工厂的发展节奏始终与英特尔存储的发展步伐保持一致,英特尔中国区非易失性存储事业部总经理刘钢七年来一直从事相关工作,从刘钢的介绍中了解到,自2012年到2019年,英特尔非易失性存储业务营收增长了10倍。不过,英特尔存储产品中除了NAND SSD方案,还有傲腾(Optane)。

从刘钢的介绍中了解到,英特尔之所以在SSD领域投入大量人力、物力,主要是由于磁盘响应CPU的速度过慢,因而需要SSD在部分场景中取代磁盘。然而,由于市场上的DRAM内存都是2D平面架构(业内其实有对于3D DRAM探索),不支持堆叠,提升系统性能所需的内存容量增长速度也较慢,容量提升速度远不如NAND。

虽然NAND技术由来已久,但直到近年来才开始加速发展。一方面,从SLC、MLC、TLC到QLC的发展提升了NAND芯片的容量。另一方面,3D NAND的堆叠技术也在提升容量。在NAND技术演进的道路上,英特尔走在了行业的前列,2018年就率先发布了QLC SSD,最近又发布了采用96层QLC NAND的SSD——665p。

从刘钢的介绍中了解到,3D NAND的堆叠技术方案有两大派系,一种是浮栅技术(Floating gate),另外一种是电荷撷取(Charge Trap)技术。

如上图所见,浮栅技术的上下单元之间是分离的,而电荷撷取技术上下层之间是连通的,当两者都是几十层水平时,差异不大,当变为几百层之后,采用电荷撷取技术的NAND上下电荷之间会发生串扰,随着时间的推移,电子会流失,会造成数据不可靠。而浮栅技术虽然工艺更复杂一些,但是在数据保留方面更可靠一点。

浮栅技术方案在数据可靠性方面的优势

因此,在NAND层数越来越高的时候,浮栅技术更有优势,英特尔采取的是浮栅技术方案,也就是说可以把3D NAND做到更高层,实现更高的存储密度。

同样支持堆叠技术的还有3D Xpoint(傲腾的介质)。刘钢透露道,下一代3D Xpoint就有堆叠技术上的创新,第一代的3D Xpoint是2个Deck,而下一代的3D Xpoint会变成4个Deck,简单看就是容量翻倍。如果把3D Xpoint做成傲腾持久内存的话,理论上说,单台服务器的内存极限将进一步提升。

从SLC到QLC,延迟不断加剧

从SLC到QLC,吞吐带宽不断下降

然而,英特尔意识到只靠NAND增长容量是无法满足需求的,从SLC到QLC使用寿命越来越不理想,而且带宽越来越低,访问延迟越来越高,跟DRAM的差距越拉越大,于是英特尔选择用NAND和傲腾两种方案并行的方式,一边持续演进NAND,一边用傲腾填补内存和NAND SSD在性能和容量上的鸿沟。

刘钢还分享了数据缓存分层的90/10原则,即在一个存储层中,90%的时间都在访问其中10%的数据,然而实际应用中,需要将常用的10%的数据放在性能更高的介质上,这就是存储分层之间的大致关系。3D Xpoint(傲腾的介质)的出现填补了DRAM和NAND之间的鸿沟,让数据从计算层到存储层的流动更为顺畅。

多种多样的傲腾落地方案

傲腾能够在多样化应用场景中使用。在实践中,傲腾的应用类型可以分为两类,一种是当作内存用,虽然性能略逊于DRAM,但价格比DRAM便宜,可部分替代内存;一种是用作SSD,延迟比NAND SSD低,但耐久性比NAND SSD要高很多。

在实际应用中,傲腾技术首先在互联网公司落地,其中:

百度把英特尔傲腾固态盘+英特尔QLC SSD的方案用在了其智能云平台上,打造了高性能的全闪解决方案,不仅IOPS更高、更稳定,为AI、高性能计算提供统一接口的对象存储服务,而且TCO还降低了60%。

腾讯云用了傲腾数据中心持久内存来打造Redis内存资源池,提升了单台设备的内存容量,让腾讯云在同等成本下获得了更高的Redis数据库服务能力。

阿里则把Polar DB的Journal放在傲腾SSD上,将Polar DB数据库性能表现提升了几倍,延迟更低,吞吐带宽更高,整体高QoS表现令人眼前一亮。

快手使用傲腾持久内存来支撑其推荐系统和Redis内存数据库方案,在对应用进行优化调整后,整体方案的性能与原有纯DRAM方案相差无几,但TCO降低了大约30%。

随着应用的深入,一些应用还挖掘到了傲腾持久内存的非易失性,使得一些大型应用的故障恢复时间从原来几个小时变成几分钟。这一特性在快手等用户的大型系统方案中均有体现。

在一些大型公有云数据中心里,傲腾持久内存被用作云主机(虚拟机)的内存,将DRAM用作傲腾持久内存的缓存层,云主机服务的成本进一步降低,这已成为部分云厂商在竞争中碾压对手的一个有力手段。

除了互联网数据中心外,傲腾在越来越多的行业得到了应用。

诸如,中国电信四川ABM系统中使用傲腾固态盘来满足REDO系统所需要的高并发、大数据量、响应速度等较高要求。

在海鑫科金掌纹识别系统中,傲腾持久内存部分替代了内存存储池存储比对样本,用更有成本优势的傲腾持久内存方案,打造了性能不逊于原有DRAM方案的内存池。

英特尔双端口NVMe SSD——DC 4800X有双控高可用设计,被视为打造高可用企业存储方案的有力武器,不仅在全球范围内有诸如戴尔易安信PowerMax的使用,在中国,浪潮也于近期携手英特尔在其中端存储AS5000G5中进行应用。双端口固态盘的推出将会让傲腾在企业级存储市场发挥更大价值。

傲腾的应用案例还有很多,目前用户对傲腾的应用水平大致分为两个阶段,初级阶段是单纯的替换硬件,比如傲腾持久内存的Memory Mode就是单纯的将傲腾持久内存当内存来用,高级阶段的应用比如傲腾持久内存的App Direct Mode则需要对应用做一些修改。

比如青云在NeonSAN分布式存储方案中使用了傲腾SSD,其中的iCAS缓存加速软件,能够自动识别冷热数据后进行分层,而这个软件就是英特尔免费提供的。同时,英特尔还开放了Open CAS架构,用户可以基于Open CAS架构做优化。

对普通用户来说,英特尔傲腾方案相对依然有一定的技术门槛,如果想要充分发挥傲腾的优势,还需要在硬件和软件上做许多优化,而对于想轻松应用傲腾方案的用户来说,最直接的办法就是选择软硬一体的OEM解决方案。

目前来看,浪潮便可以提供傲腾OEM解决方案,比较典型就有软硬一体的Ceph分布式存储方案,从浪潮公布的数据可见,浪潮提供的傲腾固态盘优化Ceph方案在同等TCO的情况下,Ceph集群容量,性能有大幅提升。

结语

在2019年,英特尔傲腾在更多场景下普及和落地,为大型互联网数据中心、企业用户等带来较高的业务价值,也让越来越多的用户也了解到傲腾的应用价值。

英特尔以傲腾和3D NAND为主的存储架构革新非常具有创新性,其中,傲腾还非常具有颠覆性。目前来看,在2019年市场上与傲腾定位类似的方案出现了好几个,这也从一个侧面证实了傲腾的远见性。

从诸多应用案例中能看到,傲腾的许多经典案例应用场景都出现在中国,这也意味着中国企业的创新热情给傲腾留下了广阔的发展空间。而创新与颠覆并非一朝一夕的事情,英特尔正在为下一代傲腾做准备。2020年,英特尔会发布下一代傲腾,随着其普及步伐的进一步加速,我们有理由相信傲腾的差异化的价值将进一步发扬光大。