质量互变规律是唯物辩证法的基本规律,它揭示了事物发展量变和质变的两种状态。
在我看来,IT领域性能不断提升也是一种量变,而量变到一定阶段则会引发质变,所谓质变,比如说是能做到一些以前做不到的事情,甚至是一些原来想象都想象不到的事情。
英特尔傲腾带来了性能的提升,性能提升的量变为创新打下了坚实的技术基础,最终引发应用场景上的质变。
为什么说,性能提升的量变会引发质变?
比如说,近几年来流行的吃鸡类游戏,就是因为摩尔定律的作用,PC性能提升,能在大型地图上进行百人规模大逃杀游戏,游戏本身做的精细又逼真,很有代入感,一时间风靡全球。
又比如,随着计算能力的提升,AI机器学习技术的兴起,能在短时间内处理大量的加减乘除运算,训练过程可以快速获得结果,推理过程也能很快得到反馈,让人脸识别得到普及。
性能就好比武侠小说中高手的所谓内力,当内力足够强大时,原本一些看似平凡的招式也有了更大威力。
在数据存储架构中,当性能高到一定程度之后,即使是一些费力的操作,比如数据压缩,重复数据删除等也变得轻松了许多,让原本高级的操作变成了日常操作,许多存储系统都强调默认开启重删压缩的特性。
有了强劲的性能,一台服务器能承载的VM数量大大提升。有了更强的性能,每台服务器的QPS、TPS大大提升,能承受更多的人的访问流量,不仅能节省机房物理空间,还能省去不少软件Licence授权费用。在这里,性能提升就等于降低成本。
武侠小说里的,功夫传承的效率非常低下,往往祖师爷的功夫更厉害,而IT领域里,往往是新的更强大,技术在创新中传承,在传承中创新。
在变化的外部环境中,性能依然是一个根本性的问题,为了提升系统性能,可谓是各出奇招,英特尔在提升系统性能方面,除了不断创新的处理器,近几年来最大的创新中还有基于3D Xpoint新介质的傲腾。
如今,全球数据量每三年翻一番,数据的量和质在变化,数据的规模、形态到处理需求也在变化。所有变革都在驱动存储架构创新,庞大的数据集,AI、物联网等新兴工作负载,都在呼唤更强的性能,以求在数据的海洋中驰骋。
近年来,数据存储对性能的追求主要靠介质创新,从磁盘到NAND闪存,到以Optane为代表的SCM(Storage Class Memory-存储级内存),不断将性能推向新高,SCM作为新的存储层级填补了磁盘到内存之间的性能、延迟、容量、成本鸿沟,为多样化解决方案奠定了技术基础。
英特尔傲腾的人生格言:让更多数据靠近CPU
数据集的不断增长,会让更多数据靠近处理器,然而,DRAM密度增长速度远远赶不上数据集的增长速度,虽然3D NAND的密度增长速度算快的,但距离CPU太远,延迟太高,性能太差,以英特尔傲腾技术为代表的SCM技术,则能让更多数据靠近处理器。
英特尔公司中国区非易失性存储解决方案事业部战略业务开发总监倪锦峰认为,英特尔傲腾技术是过去近20年来,内存和存储方面的一个革命性进步,英特尔傲腾跟NAND完全不同。具体而言,英特尔傲腾有以下几个重要特征:
第一个,它支持就地写入(Write in Place),不需要进行数据擦除就能写数据,这一特性非常关键,它不仅规避了NAND固态盘必备的垃圾回收、读-修改-写(read-modify-write)等对于I/O工作负载不友好的操作,同时也减少了对于固态盘寿命、性能以及一致性的问题。
第二个,它支持像内存一样的字节寻址,有超低的延迟表现,即使是在很大的工作负载压力下,延迟表现依然可以稳定在非常低的水平,这是NAND固态盘做再多优化都非常难以企及的,这就是介质本身的最大价值。
英特尔一方面希望数据能更靠近处理器,同时,也希望基础设施层面能够在成本可控的范围之内,这两者往往是相互矛盾的,需要建立一个相应的平衡,建立以数据为中心的高效存储架构。
上图是英特尔的内存和存储金字塔,金字塔里每个层级之间的容量、延时等特性都有一个数量级的差距,方便不同工作负载访问不同冷热程度的数据,根据的性能、成本、功耗的预算来优化架构。
英特尔傲腾结合3D NAND固态盘之后,能对更多数据进行快速访问,对更常用的数据进行最高性能地访问,将性能推向新高度之后,再搭配一个灵活的、能感知存储介质的、经过软件优化的解决方案,就能提供现代化的数据存储解决方案。
技术创新:性能的量变
英特尔傲腾技术以两种形式呈现,第一种是傲腾非易失性持久内存,以内存的形态来使用。第二个是傲腾固态盘,作为SSD来使用。
1,傲腾非易失性持久内存
傲腾持久内存可提供与CPU匹配的内存容量。倪锦峰表示,CPU的内核数在不断提升,而DRAM没有以相同的速度扩展,当内存和内核的配比逐渐失衡,内存成本可能占据整个服务器物料清单(BOM)成本的60%以上,这是很多人都没法接受的。
英特尔希望以傲腾来重新构建内存层级,傲腾持久内存既可以像传统内存一样运行,也可以利用持久性来转变架构,在实际应用中,傲腾的部署类型分为三类,可以总结为ACT,A就是Accelerating(加速),C就是Caching(缓存),T就是Tiering(数据分层)。
Accelerating(加速)方面,英特尔傲腾持久内存可提供接近内存的访问速度,从而增加系统的可快速访问的数据量,从而提高数据库的运行速度。缓存池变大就意味着数据库的活跃数据量增多,交易吞吐量会大大提升,交易延迟会大大降低,从而提升服务器的服务能力。
在实际使用中,对核心数据库Oracle进行加速后,内存查询速度提升了近10倍,对MySQL加速后,每台服务器支撑的用户数增加了差不多5倍。
Caching(缓存)方面,当傲腾持久内存作为内存使用的时候,首先就扩展了内存空间,消除类内存容量瓶颈,为虚拟化架构提供更充足的内存资源,从而提高单台设备的虚拟机数量。
在实际使用中,有了傲腾作为缓存,能将微软SQL Server虚拟机的数量增加37%,有了傲腾作为缓存,VMware支持的VDI用户数提高了87%。
Tiering(数据分层),通过修改应用来让应用感知持久层(而不只是内存层)的热数据,这是一种全新的数据分层方法,当在计算层对持久数据进行分层后,带给用户的收益非常大。
在实际使用中,使用了傲腾的运行SAP HANA的服务器,其性能比旧服务器的性能提高了2.4倍左右。另外,与使用DRAM搭配磁盘的常规方案相比,有傲腾支持的Apache Spark的查询速度提升了8倍。
傲腾固态盘
从SATA磁盘到SATA SSD的演进是介质突破了性能瓶颈,从SATA SSD到NVMe SSD是接口协议突破了瓶颈,而从NAND到傲腾的演进是又一次突破,突破了性能的限制,也突破了容量上的限制,每TB容量的IOPS数得到了扩展,让大容量SSD也能有高性能,激活了SSD。
作为SSD的傲腾也同样可以用ACT三方面来解读。
在加速方面,用傲腾SSD替代NAND SSD来存储journal数据,开源分布式存储Ceph的性能提升了67%,加速MySQL、Hadoop等等也有类似效果。
在缓存场景中,用傲腾SSD替代NAND SSD,使得单节点的VMware虚拟机密度提升了60%,从而实现了更高密度的HCI部署。
在分层场景中,DELL EMC在PowerMax高端存储中引入傲腾固态盘实现分层,将响应的时间缩短50%左右,同样将傲腾SSD替换NAND SSD的还有IBM的Spetcrum Scale和Nutanix。
实现价值:完成应用场景的质变
作为颇具颠覆性和突破性的新技术,傲腾在技术上的创新固然重要,生态建设方面,如何让用户用起来并产生价值也非常重要,真正让用户看到价值,才能完成从用性能的量变到应用场景质变的过程。
从倪锦峰的介绍中了解到,基于傲腾的合作伙伴越来越多,在实践中也看到了原来从未想象过的一些新颖的使用场景,生态系统日益壮大。可以看到,傲腾在生态方面已经打开了局面,过程中也出现了许多典型案例。
比如,阿里云在多个场景中使用了傲腾持久内存。在云主机场景中,用傲腾持久内存来替代部分内存,从而降低整体成本;在SAP HANA这种内存数据库场景中,利用傲腾持久内存的非易失性特点,将业务reload的速度提升了11倍;将傲腾持久内存作为临时Cache盘,单盘能达到百万级IOPS,读写延迟达到400ns,性能表现惊人。
又比如,人工智能创新者第四范式将傲腾持久内存与算法模型结合,加速了高可用、低TCO的金融AI类解决方案的落地。在一次实际部署时,使用了傲腾持久内存后,大幅减少了服务器的规模,TCO降低了一半左右,而数据的恢复速度和性能都有惊人的提升。
又比如,百度智能云将最快的傲腾和最慢磁带结合起来,借助英特尔傲腾固态盘作为缓存,大大提升了磁带备份的速度,降低成本,并提升了效率。
山东临沂市卫健委基于英特尔傲腾固态盘构建了SQL Server软件定义存储架构,构建了高安全、高性能、高可靠性的核心数据库存储方案,保证了数据安全与业务连续性,同时也降低了TCO。