2015年8月5日,由DOIT传媒和存储在线联合主办的2015中国闪存峰会在北京盛大开幕。本次峰会以“闪存加速数据经济变革——颠覆方式和速度”为主题,超过 500位各行业用户代表,数十位顶级学者、产业精英和技术专家出席,以圆桌讨论和主题演讲等形式,从不同角度深入探讨“闪存加速数据经济变革”这一话题。
在上午的主题演讲中,已经受邀参加美国闪存峰会的武汉光电国家实验室的谢长生主任为了支持我们中国的闪存事业,特别为我们中国闪存峰会加了一场演讲。
以下为演讲实录
谢长生:大家上午好!感谢主办方的邀请。我今天讲的题目是全方位渗透的闪存技术。本来我们要参加下周美国的闪存峰会是比较技术的,但是主办方说应该讲全面一点,不要太技术,所以我们把PPT通俗化了一点。借用华为公司的概念云管端,闪存在端这一边已经占据了统治地位,在云这端全面渗透。今天我们今天全方位渗透的闪存技术主要注重云和企业级这一端。
我想和硬盘做一个对比,这样就对我们闪存历史有一个深刻的认识。1956年IBM发明了一个硬盘,暂时还是海量数字信息存储的主角。我们信息有多大比例存到硬盘呢?70%-80%都在硬盘中。所以硬盘在人类信息革命中的功劳是大大的。核心技术之一获得了诺贝尔奖,这就是对硬盘地位充分的肯定。
1984年东芝公司发明的闪存,正在存储领域全方位渗透,即将成为数字信息存储的第一主角。现在的主角还是硬盘,但是闪存即将成为第一主角,目前正是发展的方兴未艾的时期,闪存对信息革命的重要性也将和硬盘一样载入史册。
硬盘主要的优点就是容量大,我们现在推出来的最大的硬盘是10个TB,2016年,明年产生的数据,如果只是其中的25%要存下来的话,要用到2亿个硬盘,硬盘的优点就是容量大,它也有缺点,一个是能耗大,它是机械的老转。仅仅在Idling状态也有1watt,如果是5年的话就会产生39p焦耳的能量,效果800万吨的二氧化碳,数据中心很大一部分能耗被硬盘消耗掉了。
硬盘的应用层面从笔记本、桌面机、服务器及集群、企业阵列、虚拟带库包括归档也用到了硬盘。现在有一种Made(音译)技术,大量硬盘存储数据,不用的时候硬盘都是停着的。
硬盘受到了闪存巨大的挑战。数据存储到内存到事务处理,到备份,到归档,这么多层次,我们可以在三个层次发现应硬盘,事务处理、备份、归档。但是4个层次都可以发现闪存,第一层有闪存,第二层有闪存,第三、第四层都有闪存,所以叫全面渗透。
我们看看各类存储器访问延迟特性是这样的。硬盘最慢容量最大,我们闪存在这块,在非易失存储器还有PCM在它快一些,速度从1ns到35ns之间,这是很快的存储器。我们以这个为分界线,这边叫Memory,这边叫Storage。我们闪存也可以往这边走作为Memory用,也可以往这边走作为Storage。我们看一下闪存全方位渗透是什么样的情况?
最上层Memory这块,现在有存储级内存的概念SCM。目前处于学术研究向产业转移的过程,已经刚刚有产品出来了。下面这层是大家比较熟悉的,从速度高到速度低,一个是PCIe的存储卡和盘,很多企业都推出来了这些产品。SSD固态盘有SAS、SATA,刚才几个公司都推出了这种产品。在系统上有全闪存的阵列,有SSD阵列,现在阵列用SSD代替过去的硬盘,在软件上针对SSD做优化提高性能。还有非总线架构阵列,不是用一块一块的固态盘,而是用闪存颗粒专门对性能做优化,通过互联交换式的结构,可以达到更高的性能。还有混合阵列,用部分的闪存,用部分的硬盘混合起来,得到一个性能接近全闪存阵列,但是成本又很低的阵列,这个也是一个发展很好的领域。
还有一个领域就是闪存归档,这是一个还没有产业化,但是在学术研究和个别的厂商已经开始做这些事情了。消费领域已经是闪存的天下了。
中间这些层次现在有很多公司推出了很多成熟产品,我就不讲了。今天我讲一个存储级的内存和闪存归档,这两个刚刚开始产业化,甚至还没有产业化。因为我们做学术研究,要在产业界之先做一些研究,所以这方面的情况跟大家做一点介绍。
首先是存储级内存SCM。什么是存储级内存呢?我们说一个理想的状况,我们说理想,人类要实现共产主义,最理想的情况是什么样的?存储最理想的状况是什么呢?容量和硬盘一样大,价钱和磁盘一样便宜,又快又大又便宜,还有非易失的,如果有这种存储芯片出现的话,我们外存就不要了,就全是内存了,所有的信息都在内存里了,而且可以直接访问到,这就是一个存储级内存最理想的情况,如果有这种情况下,我们整个计算机存储系统结构就完全改变了,这一天还很遥远,就像共产主义对我们人类社会还比较遥远一样。但是我们要用现有的器械近似实现这种性能,这种理想。现在存储级的内存,实际上就是这么一个接近于实现这个理想的技术。
我们看一下,我们现在是这样的,CPU访问内存,现在有闪存,有STT这些。我们要实现我们的理想,如果我们所有的数据都是在内存里,会比外存调到内存再访问快得多,而且也节能得多。我们DRAM不停刷新,我们把所有东西放在内存,能耗也是非常大的。现在我们要用比较现实的闪存,加上我们现在新出现的,但是比较贵的,但是很小,又比较快的存储器。我们进行组合,通过访问的局部性和软件的调度和硬件的调度,使它近似,最后看起来很美,看起来是一个又快又大又便宜的存储器,在内存实现,这就是存储器内存的做法。
现在有几个工作,可以提一下,IBM在瑞士苏黎世研究所做的存储器的内存,就是flash+PCM。访问的时候,内存还按内存访问,这样比现在的固态盘提高了200多倍的速度。第二个工作PMC公司可以提供8TB容量的存储级内存,随机4KB读的IOPS可以达到875000次。还有一个工作已经商业化了,Diablo公司TERADIMM,采用的是flash+DRAM,组合成了插在内存总线上的模块的话,随机IOPS可以达到1.2M,这是读,写IOPS可以达到520K,这是一块卡的性能。通过我们的闪存和一些高速但是比较贵的截至组合起来形成了一个接近共产主义理想的性能,这是闪存在存储级内存上的应用。
第二个现在还没有产业化,包括我们实验室也在研究,就是归档这层,归档都是很便宜的,保存更长时间。归档的数据特征主要存冷数据,我们经常用的数据叫热数据,很少被更新的数据叫冷数据,这个冷数据占数据的80%以上,现在大数据时代,数据越来越多,越来越积累,积累的数据,很大一部分,刚开始很热,后来就冷了,但是也不能丢掉,说不定大数据挖掘还有用。现在归档数据,很多文件,要求这些保存3年,5年,甚至有一些要保存50年以上,凡是跟人的寿命有关系的,要一辈子保存的,健康数据、医疗档案、社保、银行数据要保存50年以上。我们现在的技术对保存归档数据还是有问题的。归档数据有一个特点,只写一次,写了一次以后不要改了,被读多次,长期保存,规模巨大。主流有三种,一种是磁带库,一种是硬盘柜,还有日本、Facebook用光存储介质做,光存储介质寿命更长,可以达到100年。但是我们的硬盘基本上平均寿命就是5年,你要保持50年要导10次。
现在对归档有了一个新的要求,我们把很多东西放进来,虽然读的次数很少,但是可以很快读出来。比如说个人信息查询,医疗数据的查询,大数据分析,大数据分析的时候,要很快把数据读出来,这样现在的这几种,机械式的硬盘、光盘、磁带都满足不了这个特性。能不能用固态存储,就是主流闪存做归档呢?我们看一下国际、国内都有一些人做尝试。国外Facebook用闪存做归档的研究,我们国内有一些大学实验室做,国内公司内部也开始做研发。做归档容量一定要上来,闪存的容量有了很快速的进步,今年已经到了12纳米,一方面是线宽的降低,一方面是3D,2015年做到32层,明年可以做到48层,三星在这方面是领先的。
线宽越来越降低,3D技术普遍采用,在十三五规划中也规划了3D闪存的布局。可能会在武汉批量生产3D flash,将来会是1个PB。容量越来越大,但是价格越来越降低。红的是硬盘,到某一个时候闪存也会到达这个价格,下面这个是磁带,磁带非常低,这个点不久就会到来,这上面写的是2023年,但是实际上我认为不会那么久,闪存的价格降低,这个趋势就使我们可以把它作为归档的一种选择,因为它有更好的性能。
从性能上来说,它的进步是最快的,最上面是它的性能的增长,第二条是磁带的性能增长,而硬盘的性能增长是非常慢的,所以闪存性能增长是最快的。我们现在把闪存做归档,遇到的一个问题是什么?是它的寿命。因为现在闪存是靠保持电荷维持信息,慢慢漏,漏没了信息保存不长,时间保存的持久性是闪存的弱点。STC持续时间1年,TLC只有半年,归档有一个好处,只要写一次,所以我们可以看到,写的次数要求不是很高,归档和在线应用不一样,在线应用一秒写很多次,归档就是写一次就要变了。密度越高,写次数越少,但是容量越高。比如说TLC只能保持1年,但是过了7、8个月再重写一次,又可以保持一年,这样可以写5千次的话,按照这个理论,可以保存五千年了,不断给它更新、刷新一下就可以了。缺点,由于我们保存的是归档数据,只要写一次就够了,我们刷新它,隔十个月刷新一次,这样就可以满足我们的归档的需求,所以这是我们基本的观察。
我们设计一个数据刷新策略就可以了,我们看看是不是快到了数据不太可靠的时间,我们就把它刷新一次,这样控制器设计很简单,只是像磁带一样往里面备份,我们不需要考虑那么复杂的算法,现在我们就做了一些这样的设计,给大家做一个简单的介绍。
这个和我们普通的阵列大体是相似的,我们把单位以块的形式,因为这个比较简单,我们只是往里归档的话,垃圾回收环节就不要了,因为反复改写才会产生垃圾,写一次就可以了,所以把垃圾回收去掉,但是我们加一个数据更新的环节,刷新的环节,磨损这些还要,有了这样的结构以后,我们设计一些算法,我们基于块的FTL设计,基于时间戳的刷新策略,有了这些就有了新的归档系统。这个新的归档系统和现有的系统有什么不一样,随着闪存价格的降低,最终可以达到和硬盘差不多的成本,但是好处,在未来大数据分析的时候,会很快把归档的数据读出来,这是非常有用的特性。有了这样的特性形成了新的归档设备。我想这个会在未来几年内会有产品出现,现在还在实验室,个别的企业也在实验室做。有一些工程性的样机,但是我想未来一定会出现这样的产品。
闪存经过30年的发展,即将成为数据存储的第一主角。现在A角还是硬盘,马上我们的闪存就要成为A角了。闪存已经全方位渗透到数据存储的各个层次,在主存、事务处理、备份、归档层次都找到了优于现在介质的特性,形成了新的产品形态。新一代非易失存储器已经出现了,但是这些新出现的存储器目前还是一个很新鲜的事物,就像30多年闪存刚出现一样,它有更好的特性,但是要取代闪存还需要花时间,我想至少是10年以上,才能慢慢走向主角,现在刚刚露头,好谢谢大家!
欲知更多关于2015中国闪存峰会的精彩内容请点击查看闪存峰会全程直播报道专题。