数据觉醒是2021年中国数据与存储峰会的主题,峰会期间,DOIT总编宋家雨特邀新华三集团 计算存储产品线副总裁、存储产品线总经理兼首席产品经理徐润安就有关热点问题进行了深入访谈。
宋家雨:欢迎光临,我们一直都在谈数据觉醒,但让数据真正觉醒并不简单,您现在看好哪些技术和方案?
徐润安:这是一个比较大的问题,从根上来说,数据觉醒是要让数据发挥生命力并产生价值,我们第一个想到的是人脑,人脑不断进化并产生生产力,人脑智慧本身不断迭代,很关键的是神经元的连接,有些有用的知识不断加强,产生了我们所说的智能或者智慧。
从这个角度我们反观数据觉醒,就是需要让更多数据去连接,然后让这些有意义的连接被加强,这是数据觉醒最底层的逻辑。
这些数据怎么能够连接?数据之上的应用怎么连接?这可能是让数据真正觉醒,在技术上的条件。就就需要整个业界所有利益相关方共同努力,具体说到存储,就是要想办法打通数据边界,让数据在不同存储之间相互流转,这样才能容易建立连接;网络也是如此,需要更宽的带宽、更低的延时,以让连接更简单;计算也是一样,计算要能够快速发现数据和数据之间连接的意义,这样的话数据觉醒的条件就出现了。
数据觉醒的核心是连接,让越来越多的数据连起来,它就能产生价值,所有相关的技术都是围绕着如何让数据和数据之间能够产生有益的连接,这就是数据觉醒的技术基础。
我们存储面临很多很多的挑战,就像我在下午演讲环节也提到的一点。存储原来只是让数据存下来,过去十年能让数据存活下来,但现在就是要让数据能够流动起来,这两个其实是矛盾的,为什么呢?
原来是数据最好就在(存储)这儿,只要不碰、不动它,肯定是最安全的;现在要让数据动起来,要有不断新的访问,有读取、写入,过程会比较复杂,涉及应用也会不一样,涉及各种各样的连接,不同应用或者连接对数据都有不同要求,对存储而言,原来所要做的事情还要做,速度还要够快,可靠性还是要保证,数据不能丢或者不能篡改,同时又要兼顾到协议的多样性、访问的互通性,这是挑战。
数据越来越多,数据产生会越来越快,海量数据存储则又是一个话题。
所谓万变不离其宗,需要存储做得越快、更大、更可靠,与此同时,数据处理解决方案底层逻辑可能会有一些变化。
宋家雨:对新华三来说,与数据觉醒相匹配的存储,当属UniStor X10000吗?
徐润安:可以这么说。目前我们提供了X10000整体解决方案,基于X10000分布式存储,我们可以支撑数据分析,(数据觉醒方案)可以跑我们的平台上,技术会不断的迭代。
这里包括两个层面,很多用户如果需要存储,且是希望能够让数据觉醒的存储,可以选择X10000平台。同时,我们还提供了另外一个解决方案,帮助存储自身能够更好运用智慧中枢平台。也就是说,我们自己先别着急说服务用户的数据觉醒,首先我们自己的设备是不是具有生命力,整个环境是不是具有生命力,这也是我们关注的点。
宋家雨:对象存储和我们提到UniStor X10000,它们俩的关系是什么呢?
徐润安:这其实是两个层面,对象存储也好、块存储也好、文件存储也好,这只是一种数据存储的协议。就数据分析而言,更常用的HDFS,是另外一种协议。作为底层硬件平台或者说数据承载平台,我们希望支持不同的协议,甚至数据湖,我们也希望数据在协议层面互通,这些就是我们X10000不断努力去做的事情,帮助用户更好以这样的平台去支撑上层业务用户多种业务以及数据的访问。
宋家雨:我们知道UniStor X10000有一个非常重要的特性,GCAA(全局缓存聚合加速技术),能不能把这个技术做一些介绍?
徐润安:我这里做一个简单的介绍,GCAA技术主要有三点。
首先,利用SCM低延时和非易失性技术特点,提高缓存读/写性能。
第二,聚合,把小IO聚合成大IO然后落盘,通过缓存增加了小文件IO的读写性能。
第三,全局性,是多节点之间的,可以做到负载均衡,以及故障保障,在提高可靠性的同时也能够提高性能,主要是这三点。
宋家雨:现在新华三也在讲存储即服务,存储即服务和我们所说的云存储是什么样的关系呢?
徐润安:这是一个好问题,问题的本质是服务,我们期望讲对基础设施的需求,都转变为服务形式提交出来,是OPEX,不是一个CAPEX,从商业模式来说,这是一个必然的趋势。
云存储是公有云基础上的服务,是在客户数据中心以外提供的存储服务,我们所说的存储即服务,其实是把设备放到用户数据中心,同时提供跟公有云一样存储服务体验,所以我们叫即服务体验,或者存储即服务的概念,差别是在这里。
我相信随着时代不断演进,可能这个边界也会越来越模糊,数据流动会越来越自然,这一定是一个必然,所有从业厂商不断往里面贡献新的技术、新的产品,让这个事情真正流动起来。
用户需求的本质,其实是一个存储服务。我们提供一个服务,让用户自己将数据存下来,存下来以后无非你满足性能、可靠性、安全性等等对数据的要。用户需要既享受似像公有云存储即服务的体验,便捷性和管理的特性,同时又要有在数据中心里传统企业级存储性能、可靠性以及数据的安全、合规等等方面的要求,这会是一个大的方向。
宋家雨:怎么看待云原生应用对存储的挑战呢?
徐润安:可以说是挑战,也是说这是以后存储发展的愿景,我记得今年在杭州闪存峰会上,我说过一句话,我们的愿景,是让上层业务感知不到存储的存在。看不到存储,为什么是云原生?云原生更关注业务的本身,只要一个我要的存储,并不会说我要一个盘,或者我要一个SSD,对云原生业务来说,这是其不关心的事。
对我们存储的挑战,一是怎样能够支撑大量业务的需求,而且这个业务需求是多样性,有些元原生应用会要求不同类型的存储服务。二是对性能要求是无休无止的,只要价格合适,越快越好,同时还要可靠、可用。这要求存储要更接近用户的业务。 刚才说到过存储即服务,关注点从单体应用性能、可靠性,变成设计提供一个存储服务能力平台,对元原生应用就是一个更加匹配的点。
云原生应用要的是存储服务能力,我提供给你的就是存储服务能力,我们基于这个出发点来设计下面业务基础设施平台,就会能够适应云原生应用新的时代。此外, 对于测试有一点很有趣,其实性能边界问题,一旦负载压力不大,你会觉得所有存储都能用,都跑不出问题来,往往在边界上会有是一个挑战,用户测试实试的是这个边界。
对存储厂商来说,我们要想办法实现一个最大性能指标,怎么能够保证多个Buiding Block可以很好的组合在一起,去支撑上层的这些业务,这是我们要做的事情。
我不可能做一个无限大的东西,上层也不一定会有一个无限大的应用,但会有很多应用进程的拆成,需要对此提供支撑。