IBM:软件定义存储适合生成式AI这种现代化场景

自IBM整合了Red Hat的Ceph存储产品路线图以来已经过去一年了,IBM希望我们知道的是,在这个日益由人工智能主导的环境中,它正在取得进展。

IBM存储Ceph的技术产品经理Gerald Sternagl在博客中提到:“自愈和自我管理的平台旨在在行业标准硬件上大规模提供统一的文件、块和对象存储服务。统一存储帮助客户从运行在独立文件或块存储上的遗留应用,过渡到一个包含这些以及在单个设备中的对象存储的共同平台。”

“软件定义存储已经成为数据管理的一种变革力量,相比传统的存储阵列,它提供了极大的灵活性和可扩展性,非常适合处理现代应用场景,如生成式AI。”

Sternagl对IBM的遗留存储阵列硬件,如其大型机DS8000和FlashSystem阵列持批评态度。他在IBM收购该公司前已是Red Hat的资深员工,服务超过10年。

在他看来:“Ceph针对大型单点和多点部署进行了优化,可以有效地扩展以支持数百PB的数据和数十亿的对象,这对于传统和新兴的生成式AI工作负载至关重要。”

它可以支持数据湖和AI/ML开源框架,“支持更传统的工作负载如在Red Hat OpenShift或RedHat OpenStack上的MySQL和MongoDB。”

事实上,现在存在“一个反馈循环,其中生成式AI在大量非结构化数据上蓬勃发展,而AI不断生成的逼真数据进一步丰富和细化了对非结构化数据集的理解,促进创新和进步。”

IBM的数据湖架构watsonx.data中包含了768TiB的原始Ceph存储容量,用于数据、分析和AI工作负载。

Sternagl表示:“组织……需要一个能够加速数据摄取、数据清洗和分类、元数据管理和增强以及云规模容量管理和部署的存储管理解决方案,比如软件定义存储。”它还需要支持本地和公共云环境。

谈到软件定义存储,他指的当然是Ceph。在12月,IBM更新了Ceph,增加了对象锁不可变性以防勒索软件,并预览了对NVMe-oF和NFS支持的数据摄入到底层Ceph对象存储中。

块、文件和对象存储这类融合存储的问题是,每种访问协议实现必须意识到其他协议,这可能会延迟并可能限制新特性的采用,如NVMe-oF和NFS支持。

如果您需要在单个软件包中支持所有三种协议,那么Ceph是一个不错的选择,但您可能会发现仅块、块和文件组合、仅文件或对象和文件组合可能更快支持新特性,同时也提供更快的数据访问。

也就是所谓,有得必有失。