突破瓶颈, 重塑数据中心存储架构
在过去一年中,存储技术发生了非常大的变化,可以说过去一两年存储技术的进展,甚至超过了过去多年存储技术变化的总和。在2018中国存储与数据峰会现场,来自英特尔的刘钢带来了《突破瓶颈, 重塑数据中心存储架构》的主题分享。
刘钢表示,推动存储技术快速发展主要基于两个因素:一方面是不断涌现的数据中心新的应用、新的场景对存储产生新的需求;另一方面对数据存储的需求也有了翻天覆地的变化,要求数据存储在时延、处理复杂性和多样性等方面都有了新需求。
基于过去一两年存储领域新机的快速发展,在用户低成本、低延时和大容量的需求下,英特尔新兴存储介质组合发挥的优势,使之成为可能。英特尔奥腾技术产品,能够提供高性能、低延时的解决方案。同时,傲腾产品性能相对于传统SSD改进也是突破性的,性能均有数倍于提升。
据刘钢介绍,目前有许多合作伙伴及领先的互联网企业已经开始部署和应用英特尔傲腾技术。
以下为演讲全文:
各位来宾、各位朋友早上好!非常荣幸能有机会参加这次数据与存储的峰会,我其实参加过好几届以前的存储峰会,这是首届的数据存储峰会。正好我的题目当中也包含了这两个关键词,“数据与存储”,但这不是巧合。熟悉Intel的朋友都知道,今年是Intel的50周年庆,Intel最早是一家存储公司,后来转型为一家以PC为中心的公司。但是在过去几年当中,Intel从PC为中心的公司转型为以数据为中心的公司,在以数据为中心的技术当中存储是一项非常关键的技术。所以这是为什么我们今天的题目是重塑数据中心存储架构,包含了存储和数据两个关键词。
在过去一年当中存储技术发生了非常大的技术,可以说过去一两年存储技术的进展超过了过去好多年存储技术加在一起的进展。这是由两方面的原因推动的,一方面是不断涌现的数据中心的新的应用、新的场景对存储产生的新的需求。大家可以从这幅图上看到,数据中心的新应用包括对大数据、AI、内存数据库这些方面很多新的应用场景,对数据、存储的需求已经不再是从前那样子,只是需要更大容量、更大吞吐量的存储介质或者存储技术,而是对数据的存取的时延、处理复杂性和多样性都有了要求。所以在这样的情况下,很难想象只靠单一的一两种存储介质能满足这样数据中心新兴应用的新需求。因为我们也知道在存储领域有三件事情你不可以全部都同时获得,这三件事情是低成本、低延时和大容量。你想象一下,你很难找到一项技术说我三件事情同时满足。这就要求在新的应用下,我们有新兴存储介质组合起来发挥起来的优势,能满足这样的新的需求。
正好在过去一两年当中存储领域新技术的发展非常迅速,使我们有机会去满足数据中心新的需求。过去数据中心的存储架构最上面是DRAM,最下面是硬盘,但是最新存储技术发展让我们中间可以加入三层,来更好地满足数据中心应用的需求。我们可以加入基于OPTANE DC的内存,来扩大对内存的需求。我们也可以再加入基于OPTANE DC SSD最快速的SSD技术,来提供缓冲层。同时最新的技术QLC 3D这个技术会极大降低闪存的成本,这样可以让闪存能够尽可能多地去适应到大容量的数据需求。这三种新的技术加入,让我们对数据中心的存储架构会有一种新的构架方式。
所以基于这样的数据中心的新的构架方式,你可以看到在Intel的存储产品里面分为两大类,一部分是针对工作数据的Intel傲腾技术产品,可以提供高性能、低延时的解决方案。然后是针对大容量数据的,大家可以看到我们的QLC 3D,还有一种新的外形、尺寸的存储介质,可以极大提高存储容量。所以我们可以期待未来的数据中心的存储架构会是这样子的,你可以看到原本我们需要整整一个机柜42U才能实现一个PB的容量,而未来很可能1PB只要1个U就可以实现,这里面既包含了QLC的闪存来提供大容量、低成本,也包含有傲腾技术来提供高性能、低延迟这样一个新型的数据中心存储架构。
其实像这样的技术,我们今年在很多活动当中也跟各位分享过了。今天我想跟各位分享的更多的不只是一种新技术,而是我们可以看到其实这个新的技术已经在被我们的合作伙伴和领先的互联网公司开始在部署和采用了,在真实的部署了,改进了互联网的云计算和大数据的计算能力。其实腾讯已经在他们的数据中心当中引入了基于QLC SSD的技术,来对他们大容量的数据进行优化存储,这是在我们讲的大容量数据部分的。
在高性能这部分,我想再多讲几句是基于傲腾高性能的处理有四大特点,第一是我们刚刚提到的低延迟,然后是高服务质量,然后极高的耐用性和高吞吐率。我有几张图跟各位分享一下,这张图其实我刚开始一看还是蛮迷惑的,我在上面看不到比较,我在这上面只看到这条线,随着写压力的增长傲腾和通常的传统的固态盘SSD的延时时间是怎么样变化?黄色的线是写压力,灰色的部分是传统固态盘的延迟时间,你可以看到随着写压的增长延迟在增长。傲腾的延迟在哪?傲腾的时间在X轴,几乎没有变化,所以可以看出来傲腾的性能相对于传统的SSD的进步。到了写压力大的时候,傲腾的性能提升是63倍,所以这是傲腾在低延迟部分非常大的性能提升。
除了这个部分以外,我们也看到在高服务质量的部分,你可以看到傲腾同样也是在X轴这个部分,它可以保持一个可预测的快速服务。我们有时候讲到说一个设备的性能快,或者一个硬盘、存储设备的响应速度快,它的速度如果不可预测的话,其实对很多应用来说帮助不是很大。但如果是一个可预测的快速服务,那这个帮助就非常大,你可以看到傲腾的性能几乎是在X轴这个部分的。
除了这个部分以外,傲腾的耐用性,大家知道目前通常质量很好的固态盘全天可插拔次数大概是全盘3次吧,傲腾可以做到60次,相当于现在的通常我们看到的中等耐用性固态盘的20倍以上。
除此以外,我们还可以看到在低队列深度的时候,傲腾对吞吐量的性能提升、读写速度的性能提升都是好几倍。
所以大家可以看到,刚才我们比较的四组数据当中性能的提升都不是以百分之几十的指标来算的,最少也是几倍,有的数据达到了几十倍。所以你可以看到,傲腾这项技术对于非易失性存储的性能提升是非常巨大的。
刚刚我们提到说傲腾不止停留在产品上面,而是有了越来越多的应用。我记得在今年5月份我们的一场新闻发布会上面,阿里数据库的总经理跟我们一起同台跟各位分享了,阿里在把傲腾运用到他们的数据库应用上面,性能提高了6倍。其实阿里在继续不断地用傲腾提升他们整体平台的性能,这项技术最近也用到了阿里云,叫增强型的云盘技术,叫阿里云ESSD,它可以提供单盘百万IOPS的吞吐量,可以说是最快的云盘。采用了Intel的处理器,有傲腾的技术,也用到了Intel的QLC 3D来提供大容量,同时还有我们最新的一些网络技术加快数据传输。所以这项技术用到这次双11,极大增强了他们的反应速度,因为我们也知道这次双11的交易量是历史最高的。
这里面有一些具体的数字,当阿里云的ESSD采用这项技术之后,这是在几项关键的应用场景上他们的性能提升。在MySQL上性能提升了3.5倍,在跟交易尤其是在线交易相关的一些场景下面,PoslgreSQL这部分性能也提高了3倍。在插入数字上面性能提升了26倍。这项傲腾技术不止是在读写数字上提高,而且在真实应用场景当中、实践应用场景当中性能提高很多,这是在阿里的数据库当中,那这是在阿里的云ESSD当中,我们看到的真实的效果。
除此以外,除了在云计算和数据库当中,其实在AI人工智能也是目前非常热的一个应用,你可以在看到科大讯飞他们用到的人工智能后台当中,也采用了傲腾来极大减低了的时延,他们在做人工智能识别的时候时延其实是一个非常关键的痛点。IBM的云存储里面也使用到了傲腾固态盘,集成到了IBM的云计算里面。
刚才我们讲的这些成功案例,可能会让大家不免产生一个问题,的确我们已经见识了傲腾不仅从技术指标上很先进,从实际应用中也会带来极大的提升。那傲腾会不会很贵?部署傲腾会不会带来极大的成本的提升?这个比较可以清楚地看到,如果你看考虑这项业务部署的总成本,其实采用傲腾和通常的固态盘的成本比较你可以看出来,其实当采用傲腾来做这种应用场景的时候,我们发现它不仅是性能提高了89%,而且成本几乎相当,其实在这个里面成本还反而降低了一部分。
这样的应用场景我们在国内有好几家互联网服务商当中也有类似的场景,第一个我们可以看到青云采用傲腾技术在他们提供给招商银行的云存储方案里面,也实现了这样的傲腾的优势。你可以看到傲腾当采用和傲腾加上Intel的一种缓存技术ICAS之后,性能提升多达23倍。就是把傲腾和ICAS结合起来可以加速他已有的大容量存储的设备,这是在青云的云计算平台当中,他把它应用到了招商银行的关键应用当中。
不只是在青云,我们也看到在金山云他们搭建的深度学习AI的公共平台。地平线也是比较有名的一家做AI计算的公司,他们也使用了这样的存储,其中你可以看到架构里面他采用了开源的存储系统Ceph,当采用Ceph的时候,用傲腾做缓冲层,加速下面的大容量存储,也得到了性能的极大提升,同时缩短了时延。
所以大家可以看到,在过去的这一年当中,我们可以看到傲腾从技术变成产品,变成解决方案,到实际的部署,其实你可以看到有越来越多的成功案例在我们身边的客户当中得到部署和发生,而且他们实现了业务价值的提升。以前我们看到的很多案例是国外的,但是今天各位可以看到大多数的案例已经在我们身边发生了。所以各位如果熟悉高科技产品进入市场的曲线的话,应该很熟悉这条曲线。大概在几年前当我们提到SSD进入市场的时候,SSD实际上正好在今天傲腾这个位置,就是仍在处于跨越鸿沟这个位置。那个时候我们跟很多的OEM合作伙伴、行业领先的客户一起有非常多的成功案例,在各种应用场景当中、关键应用当中有非常多的成功案例,证明了固态盘的应用价值和带来的优势。今天我们可以看到其实SSD已经跨越这个鸿沟了,进入到了龙卷风阶段了。进入这个阶段有一个很明显的特点,就是这个产品在市场上的量快速增长,而且时不时地你会发现有缺货的情况出现,今天大家可能也经历过龙卷风这个阶段的产品特点了。
傲腾今天处于的位置正好跟几年前固态盘刚刚进入市场的时候一样,这个时候已经有了领先的客户,我们看到不仅有BAT,也包含很多的互联网服务商在开始用傲腾来改善他们的大数据、云计算、云存储平台,来改善性能。同时我们也看到像招商银行这样的领先行业客户,也在自己的关键应用当中,利用傲腾来改善自己平台的性能。我们相信我们紧密的合作伙伴,OEM的合作伙伴,云服务商等等,我们在一起能够创造更多的基于傲腾的应用场景,来证明傲腾在弥补内存和固态盘之间巨大的时延差距当中,我们能证明它的价值,这样傲腾会有更多的应用。
所以大家知道当几年前固态盘跨越过鸿沟的时候,实际上无论是存储领域还是服务器领域很多公司都获得了快速增长。我们相信在傲腾今天跨越这个鸿沟的过程当中,一些先行者也能够充分利用傲腾技术带来的优势,能够在市场上抓住这一个超越和快速成长的机会,能够跟我一起快速成长,能够把傲腾应用到更多的场景当中。
关于傲腾具体的更多的案例、更细节的部署,如何使用傲腾在数据中心架构里面。其实我们展台有很多相应的演示和案例,在明天上午我们的存储架构师的演讲当中也会提到,进一步跟各位分享如何使用傲腾和加上QLC SSD这一个完美的组合,来改善你数据中心的存储架构,提升整体性能。既获得对高频常有数据的快速访问,同时也利用这种更低成本的闪存技术QLC 3D,获得超越传统硬盘更高密度、更大容量的存储,谢谢各位!
(以上内容根据演讲速记整理,未经本人审阅)