对象存储占据C位,只是时间问题

对象存储意义不局限在存储,也可成为衡量应用水平高低的一把尺子。

对于这个观点,杉岩数据董事长兼CEO陈坚表示强烈认同,并在朋友圈点赞,

2023中国数据与存储峰会期间,我特邀陈坚先生进行专访,又一次讨论了对象存储的话题。

杉岩数据董事长兼CEO陈坚 (右)和DOIT总编宋家雨

我首先请陈坚先生谈谈对对象存储市场的看法。

陈坚表示:杉岩数据已把对象存储做到了传统行业市场,而不停留在公有云服务,如今随着AI、大数据业务应用的驱动,非结构化数据量呈现爆炸式增长,当这个数据规模达到PB数量级,文件数量上亿之后,如果用户继续使用传统文件系统,就会遇到很多难以解决问题,而对象存储恰好可以弥补、解决这些问题,也因如此,对象存储技术在传统行业市场的前景被普遍看好,未来值得期待!

“在接触传统行业用户过程中,我们不会一上来就谈对象存储,因为这对于他们来说,还是一个新的概念,新的产品和新的业务形态,需要一个重新学习的过程。针对这种情况,我们会先谈用户的业务痛点,谈论当用户文件数量激增,特别是包括很多小文件,其数量高达几十亿、上百亿规模的时候,所面临的文件查询、检索速度缓慢问题。”他说。

他特别列举了高端制造业用户的案例。

智能制造如今普遍采用人工智能的技术替代人工进行质量检测、监控,这个过程中,工业机器人会现场拍摄大量产品图片,并借助AI算法对于产品质量进行验证,把控产品的良率。工业机器人所拍摄的这些原始影像数据,会应消费者客户请求长期保存,用做产品质量追溯。

在以往的业务场景中,用户都会选择NAS,也就是文件系统来保存、管理这些非结构化数据,但随着数据的不断积累,其数据量就会累计达到亿级的门槛,导致数据检索速度无法满足需求,如业务要求的速度是10秒钟,但文件系统基本只能实现分钟级的响应,从而出现性能上的偏差,这就是高端制造行业用户普遍面临的问题,急需走出困境。

为什么现有的NAS没有办法满足需求呢?

陈坚也给出了技术上的原因。NAS采用的目录树结构的技术,其元数据所记录信息主要是是:目录、文件名、文件大小、文件创始时间等信息。与之相比,对象存储采用的类似哈希计算的方式来定位文件位置信息,其元数据也记录了更加丰富的文件语义信息,它们由业务系统生成,以标签形式记录在元数据中,当需要进行数据的访问、检索的时候,就可以在元数据层进行标签的查询和检索。

“这就像同样一张身份证影像,NAS系统通过目录、文件名等信息,可以检索到其对应的PDF等影像。但NAS不会理解‘身份证’意味着什么?因为它没有记录语义信息,因此也就没有办法通过‘身份证’这个意义信息展开检索和查询。”陈坚说。

相比NAS文件系统,对象存储更加贴近合业务应用,具有先天的技术优势。对象存储技术和业务应用结合的特点,为创新业务应用提供了想象的空间。

除此之外,陈坚也指出了对象存储的技术在数据访问方式上的优势。

NAS文件系统数据访问是基于局域网技术,在一个企业网内部数据共享的限制;与之相比,对象存储更加灵活,它属于云原生架构,可以使用HTTP协议、通过互联网来访问数据,因而更易于满足互联网+等应用场景实现,以保险行业为例,很多保险公司通过互联网,支持用户对保单信息的查询和访问,提高服务水平和用户满意度,这些NAS难以企及,数据访问的难题被对象存储技术轻松化解。

“NAS文件系统和对象存储不是零和博弈。”陈坚说。

所谓非结构化数据统一存储平台,就是同时支持NAS和对象存储的访问,况且很多用户已经习惯了使用NAS。但是与此同时,也有越来越多用户开始了解、熟悉,并开始使用对象存储技术,并将其与业务创新更好融合。

陈坚表示:从长远发展来看,对象存储技术会呈现一个上升格局,超越NAS市场规模,也只是一个时间上的问题。