倪锦峰:SSD,英特尔观点和策略

从NVMe到3D XPoint,从SSD盘到SSD 卡,从SATA到NVMe,从技术产品到产业生态,英特尔在闪存市场的影响力无人能及。2016年,闪存市场是否会有突破性进展? NVMe SSD是否会成为x86服务器的标准配置?SATA SSD何时会被NVMe替代?软件定义存储和闪存之间会演绎出怎样的故事……,围绕在闪存上空的种种谜团,需要一一拨开。为此,Dostor总编宋家雨特邀英特尔亚太区研发业务总监倪锦峰先生进行了深入访谈。

3D NAND:预期中的突破

GB/成本,仍是横亘SSD面前的坚冰,从3D NAND到TLC,甚至QLC都是希望解决成本和容量的问题,市场的拐点会出现吗?

宋家雨:从英特尔角度,如何看待SSD未来市场发展?

倪锦峰:英特尔7年前开始涉足SSD并取得了长足发展,我认为SSD替换HDD趋势不可改变。从技术层面,像3D NAND技术可以把SSD容量做得更大,成本更低,因此未来几年SSD还会呈现爆发性增长。从介质层面,现在都在讨论关注NAND,同时大家也看到英特尔和美光合作3D Xpoint新存储介质技术,相信在今后几年还会有新的NVM技术出来,促使SSD市场有更大扩展。从应用层面,SSD在笔记本、台式机等消费类产品市场得到普及,在企业级市场应用也得到广泛部署,如CDN、数据库、云计算等,双十一网购狂欢背后也有SSD技术提供支撑。

宋家雨:相比传统磁盘市场,SSD占比还不算太高,3D NAND会改变这种市场格局,给闪存带来突破性进展吗?

倪锦峰:一直以来英特尔在和行业客户一起分享数据分层的技术,也就是把数据分为:热数据、温数据和冷数据。以往SSD更多作为热数据存储来使用,如Cache(缓存)等,但随着SSD 每GB成本不断下降同时容量不断增大,它跟HDD差距会越来越小,这就导致在很多更大规模温数据使用上,会更多采用SSD。按照我们的判断, 2017年~2018年前后,会有SSD在温数据加速部署。

宋家雨:今年3D NAND会在企业级市场上取得一些进展吗?

倪锦峰:3D NAND在消费类和企业级市场都有长足进展,以前三星较早推出3D NAND技术,英特尔和美光也有3D NAND技术,相应的友商,如闪迪也有3D NAND技术。预计2016年,3D NAND会市场普及,2016年底前后,应该可以占到SSD市场的50%。

宋家雨:3D和TLC技术,哪个会发展更快一些?

倪锦峰:3D和TLC是一个并行过程。2D向3D切换,其制程技术是向回走的,这就给我们更多机会发展类似TLC的技术,由于支撑工艺往回走,使用TLC所遭遇的可靠性方面的挑战就没有那么多。所以,3D技术有利于TLC技术的应用。未来3D TLC也会得到较快发展。

阵列还是卡,这是一个问题?

闪存是未来发展趋势,对此毫无争议?但闪存应用主体形式是什么?卡还是阵列?全闪还是混闪,这是一个问题。

宋家雨:未来闪存应用的主要模式,是全闪存阵列、混合阵列、卡还是分布式软件定义存储?谁会成为主流呢?

倪锦峰:从现有企业级部署情况看,SSD不管是PCIe闪存卡,还是SATA SSD盘,更多还是x86存储替代传统磁盘应用。当然,市场也看可以看到全闪存阵列方案出来,在我们看来,全闪存阵列和闪存盘、闪存卡还是有很多区别的,全闪存阵列提供了很多方案,如HA、在线重复数据删除、以及相应数据故障处理等,主要基于企业级客户的需求。

我认为SSD结合x86服务器的应用方式会有更大发展,闪存阵列会在一段时间内会有一部分市场,全闪存阵列现阶段成本偏高,容量相对偏小,更多会应用在关键业务或者对于性能有更高需求的场景。

宋家雨:所以基于这种情况,很多厂商会提出混合产品阵列的思路,对此您怎么看?

倪锦峰:对,这方面肯定会更好一些,HDD跟SSD能够有个匹配的过程,毕竟SSD和HDD之间价差也好,或者性价比也好,在慢慢接近的过程中。

SATA SSD什么时候会被NVMe终结?

SATA,HDD的遗留技术,并不能释放SSD的潜能。NVMe 专为PCIe SSD而设计,是SATA名副其实的终结者。关键在于,替代会在什么时候发生?

宋家雨:NVMe SSD什么时候可以替代SATA SSD, 请介绍一下NVMe最新进展?

倪锦峰:我这边借这个机会,纠正一个普遍认识上的误区:NVMe只是一种协议,像以前PCIe卡对应的AHCI协议。NVMe是专门针对SSD设计的协议。现有很多人看,PCIe SSD有两种封装的形式:一种是插卡形成,被称为PCIe卡;而另外一种2.5英寸盘的形式,被称为NVMe盘。这个理解是不正确的,因为这只是物理形式不同,以英特尔P3600、P3700和P3500,它们都有两种外型:一种是2.5英寸盘的形式,标准名称是U.2,一种是插卡形式,也即我们常说的PCIe卡,或者add-in-card,但它们的协议都是NVMe,所借这个机会纠正一下。

NVMe对PCIe来说非常重要,专门为PCIe SSD设计,因它能够极大降低协议转换(SATA与PCIe之间)和协议本身(NVMe vs. AHCI)导致的时延。大家通常比较关注IOPS性能,但其实除此之外还应该关注时延,这是NVMe能带给大家的一种特别优势。最近,英特尔、美光、三星等主流厂商都在做NVMe合作开发工作,取得很大的进步。如果说2015年是NVMe初级普及的过程,那么2016年,NVMe上量会来得非常快。

英特尔在2014年推出NVMe产品,但真正上量相对慢一些,插卡用的比较多一些,盘的推广比较慢。2.5英寸NVMe盘,所采用的接口是SFF 8639,正式的名字是U.2,这个接口需要特定背板支持。现有很多服务器厂商,如联想,都支持2.5英寸PCIe/NVMe盘,但销量还不是太大。从英特尔下一代平台开始,才会大规模的普及。另外,价格上NVMe SSD和SATA SSD还有一定的差距,目前整个行业都在努力降低这个价差。

从用户实际使用习惯看,SATA用户使用的比较习惯了,切换到NVMe PCIe盘,用户一时可能没有办法发挥新的能力。例如技术上,NVMe盘相对于SATA盘可以带来5倍性能提升,但实际应用所能看到到,可能只有1倍性能甚至更少,如此每GB成本就更高,对用户成本压力就更大一些。

在生态环境方面,2.5英寸NVMe盘还不是那么的完善,预计2016年会有极大完善,我们判断差不多在2017年中期左右,NVMe能够占到出货量的50%。

宋家雨:生态环境方面,NVMe推动面临怎样的挑战?

倪锦峰:软件方面,最新版本的操作系统已经广泛支持NVMe,但是很多用户,特别是互联网客户用很多定制化系统,有些版本还比较老,这就面临升级的问题。企业级客户同样面临类似的问题,他们成百上千应用都构建在老的系统上,做大规模内核升级,难度很大。

对于新的应用需求,内核方面的障碍会小一些,但也面临应用层面的障碍,以数据库为例,有些用户习惯了传统的方案,用了新的NVMe之后,没有办法应用RAID,因为传统的RAID方式对PCIe NVMe SSD不适用,那么就只有使用软RAID的方式,对于有些人来说,观念上还没办法接受。

我们现在还没看到比较成熟支持NVMe的RAID卡,因为RAID卡原来是针对磁盘设计的,上了SATA SSD之后,RAID卡会成为性能瓶颈。假设有一个RAID卡,也是ARM处理器为核心,后面拖了很多PCIe NVMe的盘,其性能根本没有办法满足需求。你要用现有的方案,就只有用软RAID,很多人概念里面还没有办法接受。

从用户的角度看,从一种方案换到另外一种方案,用户关注的是带来哪些好处,性能提升多少,成本下降多少,也就是TCO(总体拥有成本)。对于某些应用,既要性能又要容量,使用NVMe,如果性能发挥不出来,就很难说服用户多花20%~30%的每GB成本。但对于数据库应用、CDN应用等,NVMe效果明显,这部分用户都会选择快速切换。

硬件方面,传统2.5英寸SATA SSD支持热插拔。对于PCIe/NVMe SSD来说U.2 SSD本身支持热插拔,但还需要系统支持,这个工作没那么容易。如今,很多厂商内建了系统支持,但还有很多平台工作没有开始。另外,就是支持U.2需要一些比较特别的背板设计。另外,CPU PCIe lane的限制插的比较多就不够了,肯定需要扩展,如switch等,如今这种方案慢慢在变成熟,当然这是有一个过程,另外成本也会从高往下走,这也是需要一点时间。所以我们觉得2016年生态环境更加成熟,会更加完善,上量也会非常快。

宋家雨:其实在服务器方面来讲,刚才提到8639,好像还是一个选件的东西,没有成为一个标准配制的东西,您预计在今年,或者下半年的时候会不会出现一些服务器,某些服务器会打NVMe,或者8639作为他一个标准的对外借盘,全部替代SATA?

倪锦峰:从技术导入来说,中国相对于一些发达国家还是稍微慢一些。差不多滞后6~12个月,但是腾讯、阿里、百度等互联网企业技术导入非常快,接近美国用户。我们也觉得从去年开始到今年,中国很多互联网公司这个方面进展会比较快一些,但是中国其他行业,像金融、电信等,相对来说稍微要慢一些,因为他们更多依赖于整个行业的生态系统。

大部分客户都比较中意PCIe SSD盘 (U.2) ,而不是卡,因为同样性能,同样质量可靠性,价格也是一样的,他更加愿意用盘,可以支持热插拔等等。此外互联网生态系统,自己做很多工作,比如内核升级、应用优化,这还要需要一点时间。大的生态系统方面,OEM/ODM的支持、背板成本下降层面还是需要一点时间的。所以我觉得互联网会走的比较快一些,其他行业相对来说比较慢一些。

宋家雨:从应用软件角度来讲,Oracle支持NVMe的数据库版本还没有发布,开源软件方面的情况是怎么样?

倪锦峰:我们举个例子,比如我们聊到SDS(软件定义存储),我们觉得Ceph还是很有前景的,当然Ceph还不是那么的成熟,但在电信、金融,甚至某些互联网公司,开始使用现有Ceph方案或者基于Ceph进行方案开发,做很多二次开发等等。其中,SATA盘,以及PCIe 卡,或者PCIe SSD盘应用还是比较多。

可以说,SDS如果离开SSD,将没有任何意义。Ceph原本就是比较开放系统,因此可以更快拥抱一些新的技术,英特尔努力帮助Ceph社区,更好使用PCIe NVMe性能,从而加快了NVMe SSD盘的使用和导入。

宋家雨:除了性能以外,SSD的可靠性、稳定性也是用户的关注的话题,这方面英特尔有哪些优势?

倪锦峰:当然说到质量可靠性,失效率通常是用户关注的指标。英特尔在质量、可靠、性方面一直以来非常重视,有很多投入。从产品设计层面,比如断电保护、端到端数据保护等;产品制造方面,对于工艺的监控;从产品验证方面,英特尔有庞大的认证实验室,英特尔SSD盘需要经过5000多项不同类型测试,从不同温度,不同负载,不同服务器、背板、软件等兼容性测试,验证的内容非常多,确保我们的盘有更好适应性,降低失效率。很多时候客户看到失效,并不是SSD盘的质量问题,更多的问题来自SSD和HBA卡、RAID卡、软件之间的兼容性,这会导致很多问题。

除了产品质量之外,SSD服务质量也需要格外关注,比如性能的抖动,这对实际应用的影响是很大的。服务质量的稳定性,这是英特尔产品的强项,其性能持续性或者说性能一致性可以达到90%。从可靠性的角度,借这个机会,需要提醒用户关注静默错误。通常我们并不担心SSD坏块的问题,如果程序发一个读命令,如果SSD出现坏块,出现读错误或者没法读出数据,这并不会对客户应用造成实际问题。所谓静默错误是,以所谓正确的方式,返回错误的数据,SSD或者系统本身缺一无所知,这才是最为致命的。

未来的3D XPoint

围绕着3D XPoint有太多的关注,3D XPoint与NAND可以和平共处吗?

宋家雨:未来3D Xpoint和闪存的关系?

倪锦峰:3D NAND和3D XPoint技术是完全不同的技术。3D NAND其实很简单,以前2G的结构,平面的变成3D的,叠加的层数越来越高,从32、48、64,有可能叠加到128,一直往上叠。所有这些都是为了把容量做大,成本更低。

3D Xpoint是一种全新的介质,可以做成PCIe SSD同样基于NVMe协议,也可以做成DIMM接口形式。围绕3D Xpoint,英特尔会开发一系列产品,比如DIMM、PCIe接口设备。3D Xpoint这块更靠近叠加DDR(内存)会向这个方向走。我们说3D XPoint不会替代NAND, 3D XPoint寿命是NAND的1000倍甚至更高一些,性能也是1000倍,但它的容量要比NAND小很多,虽然是DDR容量的10倍,甚至更多一些,但跟NAND容量还有很大差距。另外成本跟NAND也有蛮大差距,当然其所能带来的用户体验也会在不同的量级3D XPoint给我们更多机会,能够使得我们现有NAND和DDR之间,加了一层,能够发挥承上启下的作用。

宋家雨:英特尔如何看待软件定义存储的发展?英特尔会涉及做相关的软件吗?

倪锦峰:软件定义存储是未来的趋势,英特尔非常看好这一块,这种趋势没有办法阻挡的,我们积极拥抱这样的变化。我们也投入很多人力、物力去支持相关方案的开发,从传统的存储方式,转到横向扩展的软件定义存储,这需要一个过程。

举个例子,比如Ceph,是我们现在比较关注一个方向,但在HA等很多问题上,以及运维服务上,很多问题需要考虑,英特尔比较注重和生态系统伙伴一起合作开发软件定义存储解决方案,暂时还没有推出Intel品牌的软件定义存储方案的计划。

宋家雨:我们时间过的很快,今天特别高兴能够跟倪锦峰先生就闪存未来发展进行交流,希望我们有更多机会,能够跟我们DOIT的网友大家一起探讨技术性的话题,非常感谢倪锦峰先生。

倪锦峰:也谢谢各位。