英特尔刘钢:突破存储瓶颈 优化SDS性能

英特尔中国区非易失性存储事业部总经理刘钢在软件定义存储峰会上发表主题演讲

我们一直生活在数据智能化的时代,要求有更多的数据、智能化,数据是非常宝贵的财富。英特尔中国区总裁杨叙说过 “数据是新时代的理由”,所以如何存储数据、处理数据变得非常重要。

在数据存储部分,在过去很长一段时间内相对滞后于数据计算,所以在数据存储方面有相当多的瓶颈,也可以说有相当多机会去发展。发展数据存储这部分,我们要从软件和硬件的角度进行推动,提供创新性的技术和方法,英特尔作为一家偏向硬件的公司,我们参加软件定义存储峰会,就是因为我们要同时推动其发展。

现在看一组数据,以数据为中心的智能化时代,数据发展的速度非常快,各位过去几年可能已经体会到了数据爆发式增长,不仅是手机微信产生的数据,或者说语音产生的数据,有的时候不知不觉当中会产生了很多数据,以前在没有物联网的时候,你可能没有意识到或者没有记录这些数据,举一个简单的例子,上个周末让我印象非常深刻,我周末参加了千岛湖的铁人三项比赛,我带着我女儿过去的。因为我带着一个比赛的手环,我发现我女儿总能出现在赛道适当的位置,为我加油鼓掌。她是用我的手环产生的数据,通过组委会云服务,在她手机APP上她能随时看到我在哪个位置,然后给我加油。

这里产生了很多数据,包括我自己戴的运动手表,里面有心率、爬升高度、速度,由于人工智能和物联网的发展,我们在产生了越来越多你自己想不到的数据。我们也听到有一些领先的健康医疗的公司,他们甚至在用这些数据做到“比你更懂你”,来提供更好的健康管理服务。中国在这部分有非常多的优势,无论数据产生量,还有联网设备方面的数量,可以看到有非常大的优势,现在大家看到2018年这么快的数据增长,其实相对于整个数据洪流的爆发。这只是刚刚开始而已。

傲腾和分层存储

并不是所有数据都是一样的,并不是所有的数据都需要实时处理,或者是持续需要实时处理,有些数据你的确需要实时的分析与处理,包括工厂里机床监控的以及控制的数据,包括自动驾驶的数据、导航的数据,这些数据都需要实时处理,还有金融交易数据也需要实时处理。

但还有很多数据你只是记录下来,很长一段时间再去看,这叫冷数据,前面的叫热数据。而且越来越多数据在温数据部分,有的时候需要快速处理,有的时候只是存在那里。所以不仅要看到数据量大,而且还要看到在不同应用场景里数据是分层的,分成热数据、温数据和冷数据,那你能不能用一种技术满足这些爆发式数据的需求,无论是存储还是需求?显然是做不到的。

那怎么样用不同的存储技术来处理不同数据分层的需求?这是个非常值得关注的问题,也是现在有很多新技术。

数据分层就需要异构存储,对于不同数据层,存储方式和存储介质也会不同,这部分有很多创新。

英特尔在其中针对热数据和温数据有两项最新的创新,    一项是针对大容量的、温数据部分的,这个时候用户需要的是低成本、高密度,要做到这点我们有最新的64层的QLC NAND存储,这是针对温数据层的。针对热数据,用户需要低延迟、高性能的存储,我们为此提供了傲腾系列产品。

这两项技术可以更好的满足数据分层的需求,而且新技术的发展其实跟软件定义存储又紧密相关。

大家知道SDS最大的特点,尤其是最重要的两个优势开放性和创新性,开放性使你不必拥有传统昂贵的技术,不必依靠单一厂商供应,一个标准的硬件就可以让你实现软件定义存储的基本硬件架构;创新性就是它能最快集成和拥抱最新的技术发展,无论是处理器技术还是存储技术。

这两项新技术被合作伙伴越来越多地采用,今天也会有更多的分享。我们分别看一下这两个技术和产品。

一个是傲腾,傲腾就是我刚才讲到的低延迟、高性能。这个产品它是过去十几年以来在存储介质上非常大的跃进、进步,因为它不同于传统的NAND,在介质方面就有很大的新的提升。

除了介质以外,傲腾的读写和插入方面跟NAND不同,NAND是按照页(Page)读写块、垃圾回收、迁移的策略,傲腾读写方式是按字节来的,适应于软件定义存储源数据部分存储的需求,大家可以想象一下当你在做软件定义存储的时候,在源数据部分需要这样的读写方式。

新的傲腾存储介质和新的读写方式对于用户有四大好处:高耐用性、负载响应低延迟、可预测的快速服务以及突破性的性能。   这里强调一下低延迟,在传统的存储系统里,蓝色是硬盘本身带来的延迟,当从硬盘进化到固态盘的时候,你发现盘的延迟减少了,但是借口延迟SAS/SATA延迟还在那里,最下面才是软件的延迟。其实软件的延迟跟硬件延迟比起来都可以忽略了,是非常少的。

从互联网服务商的反映来看,从去年开始80%以上的互联网服务商采用NVMe固态盘,不是SATA固态盘,所以业界的固态盘已经很快速的切换到NVMe了,所以你看橘色部分不见了,只有蓝色的部分。

当我们采用傲腾的时候,由于傲腾介质和读写方式的改变,接口的延迟没有了,盘的延迟已经变成跟软件同等规模,所以这个时候做到延迟性能的极大改善。傲腾的低延时,加上高耐用性,是原来耐用性的20倍以上。这两项特性加到一起,就让傲腾在软件定义存储作为缓存层它是最有效的。

  英特尔QLC

针对温数据,我们有最新64层的QLC。

大概在2015年的时候,当时我们采用2 DMLC NAND跟现在3D 64层QLC NAND比,同样单位面积硅片大小,它的容量提高了10倍。

3D QLC是非常适合温数据存储的,此前固态盘密度不如硬盘,但是QLC固态盘密度远超硬盘,你甚至能够在1U的服务器里,能实现1PB的存储容量。QLC我们的期望值是它能够在温数据层更大规模的去代替硬盘。

对应我们的产品,在一个2.5寸的盘里可以做到8TB,甚至做到16/32TB。还有新的外观尺寸的固态盘,它是条状的,这种条状的更好的散热,不仅盘本身是高密度的,你在机箱里你还可以做到高密度,它改进了机箱设计,让机箱通风、散热更高,让1U机箱做到1PB的容量。

加上前面我们讲到的傲腾用到热数据,再加上QLC用到温数据,加到一起应用到软件定义存储的场景,比如Ceph的场景之下,大家可以看到这是一种新的架构的改进,你可以用傲腾,如果很高性能需求,你可以用QLC 3D NAND降低成本。在对象存储可以用傲腾加速硬盘,当然我讲的成本是达到同样的性能总体的用户成本,后面的例子会让大家更清楚了解到这部分是怎么样实现的。

事实上在国内存储公司有不少公司做了这方面的尝试,有非常令人惊喜的进展,下面我们想请英特尔在存储和计算领域的重要合作伙伴浪潮存储产品线总经理李辉总经理,给我们分享浪潮在软件定义存储的探索和经验分享。

浪潮的分享

李辉:在过去我们对英特尔的介质、傲腾的介质和QLC的介质,以及传统的TLC的介质做了两方面的测试。

第一方面的测试是我们关注怎么花钱,假如我们有同样的钱的话,我们对两种配置进行比较。第一种是我们全用3D TLC介质做分布式的软件定义存储,当然是全闪存储。第二种配置是我们用傲腾做热数据,QLC做温数据的情况下,我们会得到什么样的结果?

我们把这种3D TLC作为介质作为基准,然后再来衡量新的傲腾+QLC介质之后,我们可以从几个方面得到更大的价值。

第一个是我们的容量,因为刚才也介绍到有8TB、32TB,同样一笔费用我们可以在容量上提升2.9倍,当然这个容量还都是闪存的介质。

第二个是在时延上,得益于傲腾的几个数量级时延的提升,所以我们把整个系统的时延,这里大概99.99%的4K的读写的时延优化,进一步优化到整个把时延进一步降低52%。

在IOPS上,同样我们也有提升,大概提升了3%。

在空间和节能降耗上,我们用新的介质组合去做热数据和温数据,介质空间从11个节点降到8个节点,在整个机房空间上和节能降耗上,也会有非常好的价值的体现。也就是说在同样一笔钱,英特尔这种新的方案组合,傲腾+QLC新组合情况下,在容量、空间、性能、空间、数据中心、节能降耗上得到非常好的价值。

当然,另外一个纬度不是花钱的纬度,我们要性能的纬度。我们希望在怎么样达到性能的情况下,来节省钱。也是同样的两种配置QLC、TLC+傲腾,我们同样需要的是性能,新的组合不仅仅得到性能,在性能之外可以更多得到东西,这想这也是英特尔傲腾+QLC带来的,不仅仅是性能,容量也得到很大提升。延时上面,也是一样的,这也是傲腾。

同时在集群费用方面,大概有9%的费用下降。然后在空间和能耗上,可以降低33%。这是我们在过去一段时间跟英特尔在结合新的介质技术,在分布式存储上我们做的研究、探索和实验与验证。

刘钢:谢谢浪潮在最新的存储技术用到软件定义存储方面的尝试和探索,大家看到这是非常令人惊喜的成果。

当你把傲腾和QLC结合到一起,应用到软件定义存储上起到这么好的效果,不仅提高了性能,而且还降低了成本,甚至提高了总的容量。这都来源于什么?来源于我们采用了异构存储储,让傲腾发挥它低延迟、高性能的优势,让QLC发挥它的低成本和高密度的优势,所以实现了组合起来的更好的效果。

在云服务商部分,很多公司也做了很多尝试,这个是青云在云存储方面的服务,他用傲腾加入他的固态盘,用傲腾加速他硬盘存储,同样获得很好的效果,甚至一些金融行业客户也选用这样的服务了。

其实不只青云,阿里也在自己数据里采用傲腾,一个是他们内部的数据库,就是在进行交易的,大家知道阿里的交易数据量是很大的,他的数据库里有采用傲腾来加速整体的性能。另外他进一步的把服务推广到阿里云的服务,让他的企业客户也能享受到傲腾能够加速云存储,阿里云服务提供最快的ESSD块数据存储服务,背后就用傲腾,比以前传统存储快3.8倍,所以这个是系统级的,给用户带来服务的,不是存储介质速度提升,也是盘的速度提升,而是应用到产品上的性能提升。

除了云服务商以外,我们在软件部分非常紧密的合作伙伴是VMWare,在性能大幅度提高的时候,成本反而有所降低,当然成本降低的不多,但是我们强调的是性能提升,性能提升了几乎2倍,成本降低了1.4倍,所以性能提高了成本下降了,就是来自于刚才我讲的异构方法,各自发挥优势,针对不同层发挥方案。这套方案在美国用到很多银行,在银行业有非常多的应用,因为那边有很多VSAN行业客户在那里。

小结

在过去1、2年中我们看到越来越多的基于傲腾的方案在成功的落地,再加上QLC的搭配,这两种结合到一起,就能发挥非常多的优势。不同分层的数据需要用不同的存储介质、不同的处理方式进行存储和处理,我们有了低延迟、高性能的傲腾来满足热数据,需要实时处理的需求,同时我们也有了3D  QLC它的低成本和高密度来满足温数据层的需求,所以异构存储是最佳的组合。当我们采用这种新的存储突破性的技术,我们来帮助突破存储瓶颈,来很好的以软件定义存储的开放性和创新性结合起来,全面提速软件定义存储。