2019年,伴随着z15大型机的发布,IBM趁热打铁发布多款存储新品,包括能与Z大型机和LinuxONE服务器配合的高端存储DS8900F,包括经久不衰的磁带库产品TS7770系列,还有新一代的分布式存储ESS 3000,数据保护方案Spectrum Protect,元数据管理软件Spectrum Discover,云对象存储(Cloud Object Storage)等等都迎来更新。其中,ESS 3000的发布让人印象深刻,让笔者感受到了一个不一样的IBM存储。
IBM的存储方案本来就品类多,今年一股脑的又发布这么多新品,要怎么梳理一下呢?
对此,IBM副总裁、大中华区系统部总经理侯淼在谈到如今的IBM存储时,将IBM存储分为四大块:
第一,Storage for multi hybrid cloud,就是混合多云环境的存储构架,产品包括Spectrum Virtulize,IBM FlashSystem等;
第二,Storage for AI and Big Data,针对人工智能和大数据的方案,包括Spectrum Scale,Spectrum Discover,COS(Cloud Object Storage)等。
第三,Modern Data Protection,就是现代数据保护,包括磁带、Spectrum Protect和Spectrum Archive 等。
第四个方面是Storage for Z,针对大型主机跟存储的结合,帮客户在混合多云环境下完成核心系统一体化建设。
在笔者看来,IBM的存储门类中,包括配合大型机的关键高端存储,成套的数据保护方案以及混合云存储方案都较为成熟一些,而面向AI和大数据场景的存储需求更有市场发展空间,所以,在IBM的存储方案里,针对人工智能和大数据的方案更值得关注。于是我们看到,在2019年11月最新更新的产品中,最值得注意的是Elastic Storage System 3000(以下简称ESS 3000)。
首次采用容器化封装,兼容性、可靠性有优势
ESS 3000是ESS系列的第二代产品,第二代最主要的区别是将控制器从Power8换成了英特尔的x86 Skylake 14核处理器,采用active-active双活控制器设计,硬盘替换成了NVMe SSD,软件层面主要是Spectrum Scale(原GPFS并行文件系统),是一个比较典型的分布式存储,IBM表示,该方案主要用在AI和大数据的场景。
IBM宣称ESS 3000是端到端的NVMe存储系统,机箱采用2U设计,可支持12块或者24块盘,未压缩容量支持369.6TB(24×15.4TB),每个控制器支持最大768GB内存。
之前很好奇IBM收购红帽之后,会对IBM的存储带来哪些影响,ESS 3000里采用了最新的Red Hat Enterprise Linux 8.x,也算是收购后紧密融合的一个标志,上一代ESS其实内置的系统也是Red Hat Enterprise。
值得一提的是,ESS里的Spectrum Scale(原GPFS产品)是容器化封装的,这是G它几十年来头一次以容器化的方式进行封装,其意义主要是能加快方案落地部署的步伐,容器是在互联网领域用的比较多的技术,IBM对新旧技术融合的做法也让IBM存储产品线显得更有活力,更年轻化。
ESS作为IBM的基于x86的分布式存储系统,与许多开源的x86分布式存储方案最核心的区别就是久经考验的GPFS(Spectrum Scale)文件系统了。作为商用的分布式存储方案,GPFS(Spectrum Scale)除了更成熟,更稳定以外,与许多基于开源的分布式方案相比,还有一大优势就是全局统一命名和兼容性。
IBM大中华区系统部存储系统总经理吴磊表示,与许多开源方案相比,IBM的商用方案有更好的兼容性,而开源方案会随着开源社区的变化有一些影响,在系统升级时可能会存在兼容性的问题。IBM的ESS 3000尽管架构上有许多变化,但兼容性是IBM一直在丰富的,ESS 3000能完全兼容上一代产品,能利旧。
所以,在部署中,可以单独使用一台ESS 3000,也可以与上代的基于磁盘的ESS产品搭配使用,横向扩展到较大容量。性能方面,每个 2U ESS 3000可提供 40GB/s 的读吞吐带宽和36GB/s的写入带宽,虽说性能相比DS8900F有差距,但作为分布式存储性能表现已经很高了。
可靠性方面,ES 3000通过Spectrum Scale软件的纠删码功能确保了数据可靠性。与传统 RAID 相比,纠删码擦除编码可以在数分钟(而非数小时或数天)内重建硬盘,可最大程度地减少硬盘故障的影响,而且所需的存储开销更小,可提高有效容量以及数据完整性。
轻量化、现代化和年轻化
ESS 3000 的核心是 IBM Spectrum Scale,可以提供较为丰富的接口特性,能兼容各种经典常用的接口,比如POSIX,NFS,SMB等等,也能兼容各种新的接口,比如OpenStack Cinder,Swift,S3,甚至还兼容CSI(容器存储)接口,能对接各种类型的存储系统,比如兼容NVIDIA DGX系统(英伟达的深度学习计算平台)。
这也符合ESS 3000在AI和大数据场景中,经常需要将各个来源的数据进行对接,汇总处理等操作,然后以高性能满足AI和大数据计算需求的定位。有助于消除数据孤岛、简化存储管理并提供一致的高性能。
有细心的朋友发现,上一代ESS其实是Elastci Storage Server的缩写,而新一代的ESS 3000的话,是Elastic Storage System,感觉ESS 3000的范畴更广泛一些,似乎也透露出ESS 3000在使用场景上的泛化能力。
ESS 3000作为IBM新一代的存储产品,给人的感觉比较轻量化、现代化和年轻化。
它用时下主流的x86硬件搭建分布式存储,用时下最快的NVMe SSD提升性能,硬件上在减少专有设备的价值,价值点向软件迁移。面向的是AI和大数据这样比较新的需求场景。
所有一切都在显示出,这是一个非常主流的设定,符合当下发展趋势的产品。唯一有IBM色彩和独特优势的是GPFS文件系统,而这样的技术居然是以容器化的方式进行部署,以符合当下趋势的技术交付使用。
IBM 在2019年推出的新品有点多,新一代的云对象存储,磁带库产品,数据保护产品也好,或者在效率,在功能特性,在灵活性,在成本上的优化虽然也都有许多可观价值,但令笔者印象最为深刻的还是ESS 3000。
可以说,ESS 3000是IBM在新的存储竞争格局下推出的最符合时代特点的方案,IBM在紧跟行业趋势,同时不失原有的优势。人们对于IBM固有的印象应该改变一下了。