【编注:由DOIT传媒主办、杭州华澜微电子股份有限公司协办,以“芯存储 AI未来”为主题的2023闪存峰会8月29日在杭州开元名都大酒店召开。本次峰会由杭州市萧山区人民政府、萧山经济技术开发区管理委员会指导,中国计算机学会信息存储专委会、中国计算机行业协会信息存储与安全专委会、武汉光电国家研究中心、浙江省半导体行业协会等单位支持。
图:2023闪存峰会现场
峰会首日,宏杉科技副总工程师黄永发表了“宏杉科技SAN存储 闪耀NVMe新时代”的主题演讲。
本文根据速记整理,未经本人审定。
图:宏杉科技副总工程师黄永
黄永:非常高兴参加这次全闪峰会,我是宏杉科技的黄永。
数据时代业务应用以数据为中心。
在当下,无论部署在服务器虚拟环境、数据库系统、整合部署一类的传统应用,还是以混合云,容器编排,无服务等现代化应用,都在转向以数据为中心,目的是快速的获取数据,实时进行数据处理,获取数据所蕴含的信息和价值,支撑上层的应用。
数据的特点是海量、多类型、多源、实时处理。作为存储底座,大容量和高性能已经成为数据存储必须要完成的任务,先进的介质和高效的存储架构成为技术的支撑,安全可靠、开放生态、绿色低碳,为上层的应用提供了强有力的支撑。
全闪存技术与存储协议持续创新
新一轮的技术浪潮正在席卷而来,和全尺寸芯片相关的有两个类型。一是逻辑芯片,英特尔、AMD今年陆续发布了最新一代的CPBU,实现了更多核数跟单核的性能,并且还在PCie 5.0以及CXL的硬件规格。
不过,逻辑芯片的工艺提升的速度正在减缓,不再保持之前的摩尔定律,但也通过像chiplet,HBM以及像3DV cache技术路线在持续提升性能。这些逻辑芯片被存储控制器的性能的处理,给上游计算芯片厂商带来了保证,存储芯片保持了强劲的增长,保持了摩尔的定律。目前3D Flash cache的颗粒堆叠的层级已经到了238层,很快就看到单盘容量在200T以上的QLC另外还有DDR5的内存。
按照目前的进展,到今年年底每GB的价格将会下降到仅仅比DDR4内存高10%这样的水平,明年可能进入快速普及的阶段。
另一方面,基于CXL协议来构建的保持缓存一致性的异构缓存池,针对全程设计的NVMe的协议规范不断的完善。我们看到IO的命令集,除了传统的NVMe还有KV的支持。
这不仅使闪存阵列重新得到了性能的受益,而且,随着MMB键值存储性能的提升,未来的对象存储也会得到大量的性能的提升。
同时也看到,MBOPERICK传输层的协议,除了原有的MMEOVERROFC协议的完善,新的MVORTCB也开始进入了实际的生产部署阶段。这将大大的推动NBOB fabric的更加的普及。
闪存的芯片技术和协议是闪存安全阵列的两大技术的支点。
从目前企业级用户对于存储的选择来看,目前SAN存储依然是用户的主要的选择。IDC最近的年度报告显示,在外部存储市场,SAN存储市场份额达到了56%,依然是最重要的选择。
在SAN存储的应用场景上,单体应用特别是像Oracle数据库这样的企业级的应用,对闪存的性能需求是非常高的。金融用户的实际应用场景当中,用户要求在一台闪存阵列上部署几十个uncle的实力,性能的要求是单卷的LPS达到50以上,并且性能下降要求不能超过一个百分点。
在存储的可靠性方面,用户以国外的高端存储的标准来进行要求,包括单存储的可靠性、双核存储以及跨多站点的灾备这个级别的可靠性上,都会有着非常严苛的要求。
宏杉科技全闪存SAN的技术理念
宏杉认为,目前SAN存储架构正在全速向全闪存的架构继续演进。集中式闪存架构有三个重要的技术点需要进行关注。
首先是存储的可靠性。任何时候强调数据存储的可靠性都是排在第一位的。二是存储的高性能,包括低延时以及在进行高速数据处理的时候的低的抖动性。三是对前端业务的支撑。
现在都在讲全闪存散粉化,不断对现代存储还是对现代应用还是传统的应用,在提供闪存高性能的同时,要保持之前已经完善的存储特性,对NVMe协议的支持。
1.宏杉第三代存储软件平台ODSP v3.0
针对用户的需求以及技术的挑战,宏杉一直在闪存成领域持续研发。
宏杉在技术创新和产品迭代方面主要需求是两个,一个是来源于用户真实的需求,第二是前沿技术的推动。
今年以来,宏杉进行了第三代以及G3产品的发布。在3G产品里,宏杉实现了第三代的金融服务自控的引擎,保证了写缓存的实现的基础上数据不会丢失,也不会中断。另外,在第三代VC引擎发布的时候,也实现了技术创新:
一是控制互联协议,宏杉的SAN产品双控金融,以及未来八控在控制器互联协议上实现了统一,二是对于多控的性能提升,包括负载更加的均衡,故障控制器的切换更加的延时,三是对后端共享硬盘的技术上的的改进,在此基础宏杉进行了后端硬盘链路冗余设计,可以实现更高的可靠性、并且在故障链路的时候进行自动的切换。
宏杉G3产品采用英特尔最新的数据平台Eagle Stream进行开发的。这个平台采用了英特尔最新发布的第四代的处理器,CPU集成QAT、AMX、DSL等加速器,全面支持PCIe 5.0、DDR5、CXL 1.1。
借助于高速的PCIe通道,低延迟高带宽,宏杉适配了最新的PCIe 5.0的SSD,以及向上兼容的PCE4.0的CXL,另外配置了高达2TB的8通道的DDR5的内存,NVMe缓存直接读写,提供了充足的内存的资源。
G3产品采用了宏杉完全自研的ODSP软件v3.0版本。ODSP是宏杉最为重要的一项技术资产。
来看一下ODSB对存储引擎的封装。
它是一个分层的软件堆栈。中间最关键的是一个通用块层的实现,底层集成对接了不同的硬件设备的驱动。在此之上实现了丰富的存储的特性,各种最新的NVMe协议,来对接上层应用所下发的数据访问的请求。
ODSP经过了十几年的技术的演进和持续的开发迭代,目前的最新的版本是V3版本,实现了许多的技术的创新。
在13年宏杉首创的存储双活,实现最高业界等级的容灾保护的基础上,宏杉进一步实现了容灾保护的自动化。也就是说,这里面的环形3DC容灾技术,实现了同步复制和异步复制的在线的自动的切换。另外,在多卷的A卷的多空同时访问方面,实现了性能的提升,对应的虚拟资源池创建的卷实现多控的同时,IO的访问性能也得到提升。
2.三站点环形灾备数据保护方案
宏杉三站点环形灾备的保护方案,在同城AB两个数据中心构建了一个双活存储的数据保护。在异地的C数据中心构建了A到C和B到C的异步复制。在双活卷发生故障切换的时候,前端的复制源可以随时自动的更换,必要时可人工的干预,同时,同步复制和异步复制可以实现根据数据链路实现自动的在线转换。
这个环形3DC保护方案可以为用户进行灾备的自动化技术。
3.NAS V3性能优化
目前用于文件系统的访问需求,以及对文件数据共享的需求的性能越来越高。宏杉新一代企业级NAS存储提供高性能、高可靠的文件存储服务,支持40亿文件和64PB大规模文件系统。
NAS的需求最接近用户的应用层,宏杉根据NAS的用户需求,对原有的软件进行了重构。
实现全特性NVMe支持传统应用
对服务器虚拟化的支持,对物理服务器资源隔离的技术,业界领先的是VMWare,宏杉一直保持着技术跟进。宏杉全系列产品已经通过了VMWare对于NVMe的兼容认证,包括前端对接NVMe-of的连接,同时实现了NVMe over RoCE、NVMe over FC两种传输协议的支持,以及对前端多兼容软件的实现,对NVMe阵列集成接口的强化,也实现了包括并列辅助合并,还有跨牵连以及复制一类的性能加速。
针对传统数据库的应用,宏杉提供了端到端的技术方案,包括前端的多路径以及后端的存储双活。特别值得一提的是宏杉针对标准的NVMe协议做了增强型的开发,开发了智能的存储网络协议来构建增强型的INoF,进行快速的发现、自动部署以及故障的快速感知和切换。这些都是协议的增加和改进。
同时,宏杉的NVMe全特性可以支持数据的高可用,包括底层的双活同步的复制。
实现全特性NVMe支持现代应用
对于新兴应用的支持方面,越来越多用户采用混合云的部署,通过统一的原数据来构建全局的命名空间,向用户提供完整的数据视图。
不管是用户采用自建的数据中心,还是私有云、公有云,宏杉都可以提供一个统一的数据管理,提供统一的相同的体验,为用户提供云上云下自动的数据流动。
在驱动实现上,宏杉也实现了全特性的NVMe的支持,同时支持SAN存储环境下了对接。容器在操作系统层面实现的资源隔离,它所带来的操作性能开销更小,可以提供更多的资源利用率。
宏杉的容器存储可以对接K8S集群,优化数据存储,通过K8S Cluster的POD容器应用提供持久化存储,利用宏杉的双活同步复制技术,实现容器的应急保护。
闪存创新产品:MacroDisk MD5500智能盘柜
MACRODISK MD5500是宏杉基于存算分离架构创造一款闪存产品。
相对于传统的数据中心,新型数据中心的存算分离架构有两个关键的特点,第一个就是资源的解耦,CPU、GPU内存和存储分别构建相互独立的资源池。目前来看,存储资源池的实现度是最高最快进入商用阶段的。第二个关键的特性是细粒度数据处理的分工、数据的处理、数据的加工交由后端的高速的存储池来进行。
MD5500基于高性能的MMASID,通过MMEOOFARP协议向上层提供更高性能的容存储空间,来替代上层主机的本地的硬盘,实现更灵活、更弹性的部署,在空间利用率、可靠性以及管理方面,可以为用户带来更大的价值。
值得一提的是,红杉的MD5500智能盘柜有两种使用方式。
一是池化模式,也就是说在CRAID 3.0的虚拟存储资源池中,构建LINUX list来映射给前端的组件,这样可以发挥多盘的性能,提升硬盘重建的时间,加速硬盘的故障的重建,同时实现大条带RAID德算法,实现高达92%的空间利用率。
另外一个使用模式是直通模式,可以把NVMe划分成多个limit space, 直接提供给前端应用主机。这样做的好处是可以实现最精简的堆栈账协议,为前端应用提供最短的数据通道,从而带来及时的性能。
宏杉MD5500智能盘柜可以达到单节点100GBIOGGB的带宽。
希望在面向HPC高性能计算和人工智能训练这样的场景下,它带来优异的性能表现数据让未来无限可能。