英特尔刘钢:异构存储,完美互补

8月22日,以“闪存加速数字经济”为主题的2019全球闪存峰会在杭州国际博览中心(G20主会场)举行,会上杭州集成电路设计产业园正式启动。浙江省政协副主席、两院院士、工信部、省经信厅、杭州市及萧山区等主管领导出席。这是百易传媒(DOIT)继7月23日在西安成功举办“2019存储与数据峰会”之后的又一产业盛会。

英特尔中国区非易失性存储事业部总经理刘钢应邀出席首日主论坛,并发表《异构存储,完美互补》的主题演讲。

以下内容根据现场速记整理(未经演讲人确认)。

大家上午好!非常荣幸有机会能够跟大家介绍英特尔在存储领域的项目。在全闪领域我们发现有新的应用、新的业务,可以看到凡是新的应用对存储的要求不仅仅是量,还有性能。最近比较热门的词是5G和AI,也为计算和存储带来了更多的挑战。

为了满足这些新业务对存储提出的挑战,什么样的存储能更好的满足这个需求呢?其实答案不是某一种存储介质,而是针对不同应用场景要优化异构存储的架构。大家可以看到传统存储架构最上面是DRAM,最下面是HDD。经过演变在DRAM和硬盘之间又增加了一层SSD,这个时候当大量的存储进入到SSD之后,在SSD和DRAM之间还有非常大的差距。

这个差距一方面是容量,还有一个是时延,这方面的差距不是说百分之多少或者几倍,是几个数量级的差距。所以说在SSD和DRAM之间还需要存储架构,这个在前面演讲当中或者在最新存储文章当中也听到了SCM(存储级内存),大家最常听到的是英特尔傲腾(Persistent Memory),最近大家可能也听到更多厂商发布新的材料或者新产品来瞄准SCM这一块。

英特尔傲腾在用到SSD和内存这两个之间的时候,我们帮助用户解决哪些问题呢?大家可以看到用户面对很多难题,随着多样化应用对内存的需求越来越多,可能内存太贵,不仅是贵,而且容量不够,可能一两个T满足不了要求,要十几个T才行。

另外,还有IO吞吐量瓶颈等等方面很多问题,而通过多种存储介质的异构来做到优势互补,既能够节省成本,也能打破IO的瓶颈,还能够做纵向容量扩展。我们来看一下为什么傲腾这种新型存储介质和存储设备能够带来这些改变?

现在非常多的应用的最大挑战是时延,5G解决了网络时延,但对用户来说整个体验当中只是减少了网络时延,而不是减少存储时延,整个用户体验没有得到最终的改善。

存储时延可以看出来,刚开始如果是机械时代最大的时延来自于介质,后来时延来自于控制器,当你用SAS和SATA传统控制器的时候,你发现时延在控制器上面,尤其是当你采用傲腾这样的介质的时候,你会发现控制器就是最大时延的贡献者,所以必须换新的控制器。

在采用傲腾的时候,分为两种产品,一种是傲腾固态盘,采用PCIe的接口,还有一种傲腾,因为傲腾的材料都非常快,以至于你必须用到更新的接口,所以还有一种傲腾是傲腾内存,叫傲腾持久内存,用的是DDR4的接口。如此可以看到接口的时延会进一步降低,以及主要的存储介质在时延上的对比。

傲腾之所以能够有如此的低时延,高效率有两个原因,一个是材料本身就很快,还有傲腾是按字节寻址的,无论在做快速缓存的时候,还是做内存扩展的时候都能够很好的发挥效力。

我提到傲腾有两个系列产品,当傲腾作为固态盘来应用的时候,两个非常重要的特点,第一个,傲腾在大量写入工作负载时,它的读取时延几乎是不变的,傲腾的数据是几乎不变的。另外,傲腾优势还有它的耐用性,至少提高20倍,这是我们承诺的,其实材料的耐用性远不止这样,至少比我们讲的非常好固态盘高出20倍。

这两大特性让傲腾在存储缓存层或者快速存储这块有非常适合的应用,待会儿会讲到一些大的成功案例都是发挥了傲腾这两大特点。而且当傲腾用做快速缓存的时候不必是一对一的代替传统固态盘。原本用2T固态盘做缓存的,用傲腾只需用400、500G或者300多G,傲腾可以达到同样的效果,反而降低了总成本。

除了傲腾固态盘以外,各位可能也听说过我之前没有特别讲到的傲腾内存,当时成功案例还没那么多,我们讲一个新技术不仅讲技术,讲产品的特点,同时还要看到有没有成功的应用。

今年上半年以来,我们看到傲腾在内存领域有非常多的应用,傲腾内存是DDR4的接口,有两种工作模式,一种软件不用做任何改动,直接当内存使用,叫做内存模式。还有一种是在应用软件上进行优化调优,以便发挥更好的性能,这个叫应用直接访问模式。而且因为傲腾也是非易失性介质,所以它的数据不是马上消失的。当你把它当内存使用的时候,内存是一样的。

如果我们把这三种结合起来,傲腾内存两种工作模式加上傲腾固态盘,将其应用到不同的场景。刚才我们讲到新兴应用导致其需要新型的存储材料,把它放到这里可以看到在存储中高亮绿色的部分是非常适合用傲腾固态盘,橘色部分就适用于傲腾内存的内存模式,黄色部分比较适用于傲腾内存的应用直接访问模式,这个部分可以看到大致的对应。

接下来在生态系统里,这不是英特尔独立完成的,我们有非常多的生态合作伙伴,包括很多的软件公司和互联网公司,做软件和系统的优化。

下面再给各位分享一些具体应用。其中一个应用,刚才讲到傲腾固态盘有好的耐用性,还有非常好的时延,将它用于分布式存储里做缓存,你会发现性能有极大的提升,再往下在OST数据部分配以QLC的固态盘,这样结合QLC固态盘容量和低成本加上傲腾的高性能、低时延是非常完美的互补组合,所以异构存储,完美互补,既有了傲腾的高性能、低延迟,又有了QLC部分的低成本、大容量。

一个案例就是浪潮存储产品线副总经理孙斌,孙总有介绍,英特尔跟浪潮有合作。上次我们在软件定义存储峰会(深圳)演讲的时候,这一页是浪潮的总经理在介绍的。这次我把这一页找出来,可以看到在同等TCO情况下,当你采用左边传统的全闪存固态盘的方法,右边当你采用傲腾+QLC这两种方案的对比,可以看出来在同等价格型号下面采用傲腾+QLC的方案,容量更大,性能更好,而成本是一样的。

另一个比较是当你达到同样的IOPS,在性能一样情况下,异构存储还更便宜。当你采用异构存储的时候其实是优势互补,成本反而降低了,不要只看其中傲腾的价格。

其实阿里也是这方面的先行者,在分布式存储方面,阿里在2017年就已经发布了PolarDB也是软件定义的分布式存储,它用傲腾放到系统里来进行优化,整个系统性能提高了六倍。

除了阿里以外,百度云在它的ABC Storage云存储部分,也是用到了傲腾+QLC固态盘,在存储和性能上实现了突破。其实BAT都用了傲腾,现在来不急把它们用的案例讲出来,我就讲几个比较有代表性的。

除了BAT以外,除了互联网服务商以外,另外还有很多的互联网服务商也在把傲腾用在它们的系统里面,做快速存储或者是内存扩展。这个部分已经进入到了行业,我们看到金融电信行业也在开始采用傲腾来实现异构存储,来提高系统性能和降低成本。

这是中国电信四川的ABM系统,是一个连接事务处理,大家可以看到傲腾在里面的贡献。

前面几个案例讲的是傲腾固态盘,傲腾作为DDR4接口的傲腾内存也有很多的应用,百度的Feed流服务,根据用户画像进行个性化服务推送。这个部分需要极强的在线数据库实时处理功能,百度建立了一个完全基于内存的在线数据库原先叫Feed-Q。百度面对的是亿级的用户,当你面对这么大客户群的时候,你要建立个性化用户画像,用Feed流提供个性化服务,对内存的消耗是非常大的。而为了性能去扩大内存还是有新的方法,所以百度刚开始第一步采用内部加上傲腾内存来做优化,后来是非常大一部分运行在傲腾内存上面,可以看到性能提高非常快,而且没有引起成本增加,反而有了大概30%左右的成本降低。

还有人工智能的应用,其中的一个是在人体生物特征的识别方面,包括语音。海鑫科金在指纹识别上面也是百万级、千万级的实时生物特征对比,这个时候它也是一个计算密集和内存密集的应用,这个时候也可以采用内存和扩大内存,但成本会飙升,而采用傲腾的内存去替换部分,这样使得总体成本降低了29%。这还是没有做软件优化,直接采用的傲腾内存的内存模式。

除了刚才我们讲的这几个例子以外,其实还有很多的应用例子,包括现今短视频发展迅猛,已经超过了直播视频的量级,且对后台存储数据挑战非常大。例如快手需要一些新的应用,去优化对客户的服务,这对它的存储挑战也是非常大的,当快手用了傲腾的内存,做了一些应用上的优化,性能上得到很好的提升。

还有更多的成功案例包括第四范式,京东云,科大讯飞,青云,金山云等。我们希望看到更多这样的例子,也希望跟各位一起合作能够开发更多这方面异构存储应用。

最后,新业务和新应用带来了数据分层的需求,数据分层需要异构化存储,没有单一的存储介质能够满足所有数据分层的需要,因此数据分层需要异构存储。异构存储当我们将傲腾介质放到异构存储架构里,在DRAM和SSD增加这么一层后会发现,它很好的做到优势互补,谢谢各位。