12月9日,主题为“新存储,新常态,新应用”的中国存储峰会北京举行。中国存储峰会是每年一度的亚洲最具规模的存储产业年度大会,历时十二载,记录了存储产业的诸多变化,每年的存储峰会都吸引学术界、产业界和最终用户代表的积极参与。
在存储峰会的下午场主题演讲中,华中科技大学教授、博士生导师,信息存储系统教育部重点实验室主任,武汉光电国家实验室副主任谢长生发表了题为《迎接主流存储的闪存时代》的主题演讲。
谢长生的演讲从主流存储演变的历史视角,为听众盘点了自人类出现以来,各种主流存储介质及其发展轨迹。从光存储到现在的磁存储,再到电存储即闪存。闪存将在2020年左右成为主流,并有超过60%的信息都将存储在闪存上。
他还指出,我们要正确认识闪存成为主流存储介质即将遇到的挑战和机遇,以及意识到闪存对技术架构和软件生态的改变。谢长生建议,围绕3D NAND芯片构建完整的产业链,只有上下有互动,才能促进核心技术发展,产学研用结合,前沿研究和技术开发结合,加强高校与企业的合作,建立针对闪存产业连的公共测试服务平台,国家标准,在国际标准上取得话语权,中国有机会,有责任在闪存技术和产业上做出应有的贡献。
以下为谢长生先生的演讲实录:
大家好,我来自华中科技大学信息存储教育系统实验室,我们的存储实验室有40年的历史,是一个学术研究和人才培养的单位。我们研究各种存储技术,如光存储、闪存系统等研究。我们这个单位有50多位老师,300多位研究生组成,是一个具备国际水准的高校研究生团队。我们的学校坐落在武汉,另外,有一个投资240亿元的闪存基地也在武汉。
今天我演讲题目是“迎接主流存储的闪存时代”。主流存储是在变的,我们要迎接闪存时代的到来,就需要了解什么时候是主流。这也是我今天主要阐述的问题。
我们看一下这个图,这个河流有主流也有很多分支,河水的主要流量都集中在主流部分。那么,我们先来下一个定义,那就是什么主流存储建设?那就是现有的条件,除人脑之类,人脑使用某种存储介质保存信息的总量如果超过60%,那么这种存储介质就称为主流存储介质。回顾历史,出现过很多不同的主流存储介质。
最早的主流存储介质是石刻,大约出现在4万年前的西班牙某个半岛上,也是人类最早在石头上留下的痕迹。在我国宁夏的大麦地,1万多年前也有这种文字出现,石刻是人类最具价值的研究领域。我曾在卢浮宫见过非常有价值的,有几百条法律的石刻,是300年前由石头记录下来。中国早期的主流介质就是竹简,我们国家大概使用了800年。虽然在世界范围内没有很广泛的流行,但是对我们中国非常重要。那个时期正好是老子、荀子、屈原那个时代,正好记录了咱们国家思想的高峰。如果没有竹简,中国最高峰时期的思想没有办法被记录下来,因此竹简对我们中华民族做出了巨大贡献。中华民族思想最高峰也就出现在这个时期,后面就没有再出现。
早在5000年前的埃及就有莎草纸,古欧洲是羊皮纸,是将麻打成纸浆制成纸张,这也是中华民族对世界最大的贡献。这个历史我们稍微回顾一下,上面讲石头、纸、竹简等等,可以在上面刻字和这个是一回事,这个是用光反射。其实这就是一个光存储,现在看到的竹简主要是在白的地方、黑的地方反射不一样,才能辨识得出来。现在的蓝光技术也是一种技术突破,就是在最近几年形成的,它属于冷数据存储。日本公司已经将其产业化,冷数据有很大的存储量,能耗低。光存储这几年有很大突破,澳大利亚斯威本大学提出突破衍射极限的超分辨光存储,可以把这种密度大大提高。突破衍射技术在2014年获得诺贝尔奖,可以达到100TB的存储容量。
第三个是英国南开普顿大学,实现通过玻璃介质永久保存数据。在1000度以下的实验环境下,可以做到信息不丢失,做这个实验的是我们学院的一个学生,并以此开始创业。
进入数字时代以后,当前的主流存储是磁存储,磁存储发明很早,1878年就出现了。1920年德国把薄钢片用于记录声音进行广播,1956年IBM发明了第一个硬盘。实际上这个硬盘在我们个人电脑、服务器、大型数据中心中都在被大量使用。而且目前还是我们的主流存储,我们来看一下第一台硬盘,是这么大一个东西容量只有5MB,今天很小的一块硬盘已经达到10TB容量,这是一个巨大的成就。1956-2006年,今年正好是硬盘发明60年,这个成就非常惊人。1956年是2000bit/in²,面积速度提高5亿倍,“60年5亿倍”这个成就是非常惊人的成就。据统计,80%的信息目前还存放在硬盘之中,硬盘仍是当前大数据时代的主力。2007年,诺贝尔物理学奖就是因为巨磁阻效应在硬盘中得到应用。而现在,磁存储已经接近了物理极限,发展变得很艰难。面对这一问题,我们有三个解决方案:分别是能量辅助,瓦记录和图案化记录。这三种技术单独使用只能提高5倍,如果综合使用可以提高10倍,但目前实现难度还很大。由于现在闪存发展太快,还等不到硬盘进入这个实践,就已经被闪存超越了。而且,硬盘的机械延时不可消除。
下面我想为大家分享一下闪存成为主流存储的三大驱动力,首先是新的应用已经爆发性增长,这种新的应用只能用闪存,不能用硬盘。比如我们的手机是不可能放硬盘进去的,目前世界上已经有40亿部手机,到2020年还会增加20亿。5G时代已经到来,下载视频是非常容易的事情,那么以后5G手机下载视频就非常容易。现在手机最高容量已经是128G,马上就要到512G,最后到1TB。试想一下,60亿手机,就是6ZB。预计到2020年,全世界数据量将达到40ZB,手机就占到15%,这个应用是完全新增出来的。
再看现在的智能汽车,也能达到数百万台的新容量。还有无人机、智能机器人、物联网,这些都不能用硬盘。而是被闪存行业垄断。
第二个驱动力是大型数据中心对性能的要求越来越高。硬盘已经很难满足大数据实时分析需求,更需要速度。数据中心对能耗的考虑也要求更换硬盘为固态盘。
第三个驱动就是价格,闪存价格持续下跌。2022年左右将与磁介质持平,并全面替代硬盘。
第一条绿线是闪存下降趋势,第二线橘色的是硬盘下降趋势,第三条蓝色线是磁带。这些下降趋势应该都会提前,因为随着工业的进步实际上的发展会快于预期,我个人的估计是2020年左右就会持平。
性能方面,闪存每年有40%的增加,硬盘在性能方面是具有劣势的。如果要继续降低闪存介质成本的话有三个途径,制程升级、多级化、3D NAND技术。SLC、MLC、TLC、QLC技术相应提高,价格也慢慢降低了。3D NAND技术已经应用于很多产品,实验室也在致力于128层堆叠的研究。
目前几大主流厂商,如三星、东芝、海力士、美光。三星从2013年逐渐开始壮大,现在到64层,多级是TLC、现在是QLC马上要出3D,价格就会下降很多。
下面我想跟各位分享一下闪存时代的技术挑战和机遇。第一个问题是存储颗粒层次,这个层次除了刚才说的三个措施以外,还需要很多的经验积累,我们的实验室曾测试过几个不同厂家的颗粒,其颗粒内部每个块的性能都是有差异的。
第二个是固态盘控制器层次,关键是控制器的设计,这个控制器的设计其实是一个非常复杂的事情,是一个需要动很多脑筋的事情。虽然从性价比来看,闪存颗粒是一个非常理想的存储介质,但其存储原理并不是一个简洁优美的过程。因此,如果没有很好的控制器设计弥补原理上缺陷,数据存储将是不可靠的。
控制器设计是一个极具挑战的工作,第一是介质管理/信号处理问题,解决颗粒的原理导致的耐磨性和耐久性问题。第二个是纠错能力强的ECC算法,工艺越先进,误码率越高,需要更强大的纠错编码,解决数据存储的可靠性问题。
有一些数据放置策略、管理调度算法研究与设计,解决与放大、性能抖动等问题。
我们测试过一些产品,具体过程是这样的,先把盘写满,新盘的时候大家看不出来,但是写满的时候,只要垃圾回收一开始运作,就可以看出差别。慢慢有很多新的抖动,到这里下来,有时候下降的很快,很多时候资源占用下降很厉害。如果设计的好,这个性能下降就会很明显。还有一些厂商设计的产品,这个延迟时间小于100微秒,有的甚至到毫秒。还有很多细节,如果这边是11和10的时候,这时候写的编码也有很大的影响,这个细节实际是我们需要注意的。
第三个挑战是全闪存阵列层面。我们会关注硬盘和固态硬盘的差别,阵列软硬件设计需要充分考虑闪存介质特征。由于固态盘的失效预测比硬盘准确得多,可以采用预警迁移技术,使阵列的数据在失效前转移到新的盘上或新的块上,从损坏重构的模式变到预警迁移模式,会大大提高盘阵的可用性。再一个把计算放到闪存里面,这个可以克服瓶颈。
软件层面来看,传统的系统软件如操作系统、文件系统、数据库系统都是根据磁盘的特性设计的,改用固态盘后,特性很多都不一样了,需要针对固态盘重新设计,否则会浪费固态盘的性能,有时还会带来负面的影响。硬盘时代,协议栈的开销与机械延迟开销相比可以忽略,而闪存时代,协议栈的开销就显得比例过大,开发轻量级协议栈就显得非常必要。
最后,我想讲一下中国的闪存其实是有很大机会的,硬盘时期的机会已经错过,闪存时代机会很大,因为集成电路、半导体、软件、硬件经过长时间的积累已经非常不错,特别是在阵列方面已经有十几年的经验积累。应该说这个基础比较好了,缺的是闪存颗粒,现在中国的国力,使我们有能力投资闪存颗粒制造企业。现在武汉新芯和长江存储数百亿美金的投入就是典型的案例,如果运营得当,有可能会成为世界第五家闪存芯片制造巨头之一。闪存颗粒的国产化将刺激下游产业的大发展,我们建议围绕芯片来部署全闪存产业链。现在芯片出来,我们要根据它定制控制器,设计我们的全产业链,设计我们的数据中心,这样我们就可以把这个产业链建立起来。
还有公共平台的建设,比如测试平台。我们这个单位希望为行业做一个公正性的第三方测试中心,可以为各个厂商的不同的设备和阵列做一个评测。