浪潮存储产品部总经理孙钢:“释放数据价值,驱动业务转型”

12月5日,由DOIT传媒、存储在线和中国计算机学会存储专委会联合主办的2017中国存储峰会在北京盛大开幕。本届峰会以“数据中流击水,浪遏飞舟”为主题,吸引来自政、企、产、学、研、媒体等各方参与者超过2000人,观看在线直播观众超过7000人。

本届峰会对中国及全球存储市场现状及发展趋势进行了深入解读,与此同时,业界领袖及学术专家一致认为,从信息时代走进智能时代,数据已成为企业的重要资产。作为数据生存之地,存储在数字经济中将发挥基石作用,只有解决了存储的问题,才能通过数据创造出更多的商业价值。因此,如何让存储更敏捷,如何依靠软件定义和闪存技术实现存储产业的转型升级,成为与会嘉宾备受关注的话题。

浪潮存储产品部总经理孙钢先生在2017中国存储峰会上发表主题演讲,题目是“释放数据价值,驱动业务转型”。

(以下内容根据演讲录音整理, 未经本人审定)

浪潮存储产品部总经理孙钢先生

孙钢:尊敬的各位来宾,大家早上好,非常荣幸来到这里,去年其实我们有讲到新的技术和应用,以及数据和存储的转型,今年年初浪潮的存储发布了新一代的智能存储,也想借存储峰会的机会,给大家做一个回顾,跟大家分享一下面对今天的大数据时代,我们的存储何去何从。

首先从一个观点开始,AI化的世界,创联万物。乌镇的互联网大会,所有的IT界大佬都在谈AI,我们年初发布智能存储,到年底发现基本没有存储不是智能的,几乎没有人不谈AI。在互联网大会上也提出,2017年是AI商业化的元年,那么AI化的世界创联万物。AI对整个IT世界有怎样变化?

谈到AI,在各种领域大家都谈到了五花八门的AI,要想理解AI的本质,就要回到AI初始的企业。大家都知道AI是有深度学习的算法,它其实在2016年就出现了,促进AI发展是一个并行计算的模式,但是真正让AI发挥威力的是2016年大数据在AI的驱动上,通过阿尔法狗战胜了李世石,我们发现了AI的潜力。

AI的本质是通过深度学习的算法,GPU定性的方式,在大数据驱动了AI地发展。

为什么今天我们谈AI不谈其他?今天我们看到互联网等各种各样新的技术,他们有什么样的关系?

举个例子,比如说我们刚刚跟国内知名的几家厂商正在做的有关AI的人脸识别的事情,以前我们看到视频的领域里,基本上都是解决一个视频接入和视频采集的问题,但是现在我们会发现很多的视频厂商都在尝试去做一些智能化的东西,在乌镇的互联网大会,所有的人入场的时候基本都不用买门票,通过刷脸可以进入,刷脸同时会捕捉你所有的信息。以前的视频采集方式,可能是在每一个边缘或者每一个采集端看到这个数据,全部要回到中心处理,今天在视频厂商里,尝试做一种视频的特征采集到中心,由中心系统建模,通过AI的方式输出模型,未来我们就会发现我们前端的摄像头就可以定像或者抓取某一些特定特征的特点,在前端的视频端有以智能的方式,这就是AI对我们世界的促进和变化。

另一个例子,也是我们最近在做的,是医疗新的尝试。大家知道医疗十几年前几乎不保存数据,之后有法律法规的要求基本的保存数据,现在的医院会保留几乎所有的数据,其实是用来做更深一步的精准医疗或者AI智能。我们看到医院看病的人都做疾病的治疗,但是我们今天提出一个新的课题,就是慢病的治疗,通过一个慢病的治疗,我们发现每个人的特征,或者每个人的身体健康的情况,我们可以通过互联网IoT的方式随时监控你个人的特征,还有病理特征,通过远程或者通过建模的方式对疾病产生积极治疗的方式。

今天,互联网的时代已经到来了,下一个驱动或者一个变革的方式就是物联网的模式,但是我个人认为,互联网仅仅是一个简单的连接,并没有发挥最大的威力,最大的威力就是所有互联网上的东西都有一定的智能方式,所以谈到未来IT的世界,我们初步想到物联网是万物互联,但是下一步的问题应该是万物互动。IT的世界是从万物互联到万物互动,对数据来讲是什么样的变化?数据,我们以前谈的是数据的共享,未来应该谈的是数据的流动。所以这是我们对AI的世界或者AI的变化对整个IT驱动的观点。

谈到了数据,数据有这样一个模式,从数据的采集到数据的处理到分析,过去的模式,包括现在的模式,从数据采集出来是信息,信息变成了知识,然后知识进一步的形成决策,今天在早上我也听到了传统的新的模式,刚才我们谈到AI的时候,实际上也谈到了一个模式,来一个AI化的世界,对数据有什么样的变化?这里也跟大家做一个比喻,其实大家有没有注意到我们谈到大数据,再谈到AI方式的时候,大数据非常大的特点就是数据的关联性,数据的关联性就是当你想到A可以联想到B,当你看到人脸可以抓取到他个人的信息和数据,这种模式在现实生活有没有存在?其实这就是我们人脑思考的模式。包括刚才AI的模式也类似于人脑或者人的神经性。去年我们谈了很多,业界很多朋友谈到新的IT模式或者旧的IT模式,快速的和慢速大量数据应用。想象一下,这是不是特别像我们整个人类的神经系统,未来的万物互联世界实际上应该是我们用中枢神经集中式的处理,末梢神经要通过感知和接触数据形成分布式的数据处理方式,同时形成回路,就是刚才我们谈到的,在AI化的世界下,数据和整个IT架构的变化。

在过去,我们从数据信息知识到决策,更多的集中在数据采集和交换以及数据的共享上,今天在大数据时代下,最大的区别就是过去的数据只保留有价值集中化的数据,可以直接拿来处理和决策,今天的变化是数据本身采集以后还能产生更多的数据,产生更多的数据以后会产生更多的价值,产生价值以后可以进行建模,可以对它进行分析,反过来影响我们的数据采集的模式。大家可以看到人类简史的作者写了未来简史,他说未来的气象变化可能不仅仅是返回一个气象的预测,或者是一个气象的信息方式,更多的是通过不断的监测不同的气象变动方式,通过建模形成针对变化,可以在不同的气象变化下,可以作出我们的模型和反馈,这是数据在AI世界下的变化。

同样的观点,到2025年,全球数据量会达到163个ZB,这么大的数据量情况下,对我们的IT系统和数据存储的方式有什么样的变化?结合刚才讲到的AI化的观点,再回到我们比较关心的话题,大家可能都在想下一步IT世界应该是什么样的?

今天的AI给我们带来了很多的惊喜,也带来了很多的担忧和恐惧,不同的人表达了对未来世界的担忧,我们想象中的世界可能很多的时候会从电影里看到不同的情形,一种是类似未来的世界,人工智能会超过人类,多数会想到终结者,通过机器会奴役人类,实际上在关心热点的时候,我们恰恰可能忽略了一个最基本的方式,比如说刚才我们讲到的AI对IT的改造,从根本上来讲,是使我们的万物互联到万物互动,所有我们连接的设备都可以处理和传输数据,从数据的层面来讲,我们不仅仅是要增加中枢神经的处理环境,更多的是我们如何处理海量大规模低密度的数据,要通过边缘计算或者通过我们对数据的感知能够实现数据新的采集,到数据的分析,再到数据的智能化处理的过程。

未来AI化世界对IT的最佳模拟是什么样的模型?大家都知道新的阿凡达会上映,为什么不选择灾难性的影片,真正的思考是在未来AI化的世界下,在数据流动的情况下,我们的世界应该是什么样的。大家知道阿凡达的世界,潘多拉星球是一个非常原始的社会,不应该作为新型科技的代表,但是潘多拉的星球世界有一个原生态的系统,它的DNA就是我们今天讲到的万物互联,或者说我们讲到的万物互动,阿凡达的世界最大的特点就是所有的人和智慧树到所有的生物之间,都可以通过某种方式来连接。

另一个问题,是我们可以通过各种方式连接,大家可以交换数据。大家注意阿凡达的世界里,数据的交换不仅仅是一种能力,更多的是一种意愿,通过交换的方式,大家第一实现了数据互相的交付和流动,更重要的是我们发现了在数据交换中的价值,这样形成一种阿凡达的世界。这只是一个比喻。

回到现实生活中,在一个所谓的AI化世界或者数据发生新的变化,从顶层的应用是一个AI的变化,最大的挑战是什么?拿这个模型做一个比喻,我们今天谈到了云计算,大数据,互联网,其实你想象一下我们是不是可以想象为类似阿凡达世界起步的模型,今天通过万物互联,通过万物互动,通过每一个前端设备的智能,实现每个设备之间和中枢神经之间的交换,在这样的系统里,如果我们认为今天是在这样的世界起步的话,在AI化的世界,最大的挑战是什么?

第一,以什么样的方式实现智能?类似终结者天王那样的智能,还是另一种更加现实更加贴近IT和业务的方式?

第二,我们如何建立,今天我们谈到了云计算和大数据,但是我们真正的回到数据来看,我们现在有多少的企业已经完全的用云计算的方式来处理我们的业务了?有多少大企业已经在云端实现了互联互通?

这是两个最大的问题。

用这样的模型回到今天我们做的产品,或者我们产品的智能存储的思考。

首先,我们如果把刚才说的阿凡达世界换成另外的现实世界,一个多元的环境,今天我们要面对和处理的是面向多云环境的智能存储,怎么样在一个多云的环境处理好你的IT和应用,怎么在多元的环境处理好你的数据的流动。

大概看一下里面分了几个层次,第一个是从最底层的介质,再到上一层的资源池,再到处理的平台,再往上是我们各种各样的应用,就好象在阿凡达世界看到的不同生物状态一样,最终我们形成多云的环境,用我们现实世界的话来讲,就是大家热议的传统IT,公有云还是私有云。

接下来给大家分享我们从哪一个方向在努力,我们今天在做什么样的技术思考和技术积累。

第一,如果我们的未来世界不是像天网和黑客帝国的系统,而是像阿凡达的世界,如何处理智能,应该通过什么样的方式实现智能?既然我们回到了现实世界,我们年初发布了智能存储,所有的智能系统首先应该实现感知,如果没有感知,系统做得再复杂,只能说你的算法非常先进,但是远远谈不上是智能的系统。目前我们在新的智能存储里,是在我们的介质层面包括I/O还有应用层面一共放了一千多个传感器,通过这样的方式可以去感知到故障和问题以及设备的状况,还有I/O的状况,也包括应用的一些变化。

针对这样的状况发现问题,目前可以做到从半天缩短到分钟级。未来我们会通过发现的机制,感知的模式,不断的通过在存储里加AI的算法,通过算法把发现问题的机制不断固化下来,把这种模型拷贝到其他的机器上,通过装机的客户,比如有千万的客户不同问题的汇总,大数据的模式,把这种模型建模起来,就像刚才谈到的在视频领域里,通过不断的训练的方式去形成模式,形成一定的模型,那么在存储里,可以形成一个固定的模型,把它分布到所有的机器上,通过这样的方式,可以实现真正的智能。

第二,今天如何建立云化的世界。刚才谈到云的问题,第一个是能力的问题,第二个是意愿的问题。今天的技术是原生态的,可以跟所有的云平台对接的,但意愿就比较麻烦,因为之前分享过一个观点,今天我们讲到数据的社会化,数据没有被最大化的分享出来,可能今天所有的数据在企业或者政府的数据里,今天没有分享是有各种的原因,比如安全的考虑,隐私的考虑,今天的企业上云最大的问题就是上云以后我是不是还可以像原来一样去处理我的数据?一下子带到阿凡达的世界里,云给了一个接口,要不要接上去?接上去你要分享什么样的数据?

这是一个非常真实的例子。我们跟阿里正在做云备份的方式,通过这样的方式帮助企业上云,我们的企业客户可能首先讲到了意愿问题,数据要安全,要隐私,可以通过云备份的方式,所有的主要数据都留在本地,你的数据需要做一个备份或者拷贝的时候,我要放到云端,你既可以感到安全,又可以把数据带到云端,下一个步骤可以做云网端,可以把大量的数据还有设备保留到本地,但是数据可以放到云端。

我们跟阿里在做下一个项目,是云缓存,构造只有最集中的或者最热门的数据,需要在本地处理,本地就像一个缓存,把所有的数据,或者我需要备份的关键数据全部放到云端,通过这样的方式解决上云的能力问题和意愿问题。

简单分享浪潮在AI化时代对存储下一步的发展思考。

一年以来我们的智能存储到底有什么样的表现?首先,浪潮存储三年以来增速每年超过了60%,G2智能存储上市以来智能化存储已经超过了2亿销售额,软件定义和高端存储都有很明显的变化和增量。

回到大家热议的智能化的时代,我们每天看到的都是周围各种各样的变化万千不同的应用和不同的技术的挑战,我们应该思考如何对数据和业务转型做好支撑,处于智能化的时代变化上,我们把这个核心称之为智能化的存储,通过这样的方式助力企业实现数字化的转型,谢谢大家!