在4月15日开幕的IPF2021浪潮云数据中心合作伙伴大会上,浪潮存储发布了“元脑新存储生态”策略,提出了“场景共同体”的概念,此前存储更多是通用存储的概念,从“通用”到“场景共同体”预示了怎样的存储新变化,为此,DOIT宋家雨总编特邀华中科技大学武汉光电国家实验室教授、博士生导师谢长生、浪潮存储产品线总经理 李辉开始了一场经典对话。
对话从图灵机切入,谢长生表示很高兴提到图灵机的模式。他指出:现在商用的信息系统、计算系统都是在图灵框架的指导下,当代计算模式的根就在这里。都说大道至简,存储就是那个无线长的带子,磁头读写就是处理,带子移动就是数据传输,图灵机已经说得很简单了。理论告诉我们:存储第一要大,第二要快,如今AI、云计算都要非常大的算力,需要存储能够跟上,围绕着容量、处理性能做文章。
李辉认为这就是计算、存储要协同发展,计算的算力在一直前进,存储也要在容量和性能上能够跟计算匹配,并驾齐驱。“只要我们能够有无限的算力,只要我们能有无限的数据,我们就能计算整个世界。这句话让我印象很深。” 李辉说。
那么,计算和存储匹配吗?
李辉的观点是:在人工智能这种应用场景里面有三个核心的东西:数据、算力和算法。新的人工智能模型 GPT-3,模型参数已有100多个亿;类脑计算模型参数要到几百万亿,对于存储而言,这意味数据带宽还要有比较大的提高。
“应对当前人工智能计算应用,我们的存储是够的,但是随着新的人工智能模型的演进,所谓硅级计算、碳级计算,就是类脑接近人脑的话,无论是计算还是存储,都还有很大的空间和距离,等着去探索和提升。” 李辉说。
更加具体一些,在存储介质技术的进步上已经突破了瓶颈,目前存储的瓶颈是在传输和网络上,无论是节点内数据高速处理,还是节点间海量的数据同步上,都需要在互联或者在网络上、传输上再做更多的工作,像PCIe技术的进步,像100G,400G以太网技术进步,像MIA这样一些新的协议技术的进步,正在往这个方向去突破。
对此,没有异议。
接下来话题转向了“场景共同体”。
据李辉透露::场景共同体这个概念,主要是考虑海量非结构化数据、超大规模应用场景下产生的一些新的需求。
“过去我们接触的非结构化数据、超大规模应用,最常见的场景是高性能计算。但现在除了科学计算,又演进到智慧计算,很多已经应用到我们的企业级应用场景,应用我们的商业环境。比如说智慧交通的环境、医疗影像、医学影像场景,以及金融里面的一些场景,包括互联网里面的视频应用场景,金融里面的大数据,以及相应的AI,这些都是非常多的一些海量的非结构化数据大规模应用。”他说。
在这种大规模应用当中,我们看到了整个体系结构的变化,包括现在上层应用都已经是平台化了,比如医疗影像有医疗影像的平台,4K、8K、高清的平台,云计算有云的平台,各种各样的应用平台。大家都是在按照工业标准和行业标准在做自己的产品,在做自己的技术。但是对数据处理,每个应用场景有它自己独特的需求。为此,我们就提出了“场景共同体”的概念,在通用产品的基础上,通过产品定制、技术的创新,更好去满足这些场景对数据存储的要求。
李辉还举了个例子:现在每个医院都有PACS应用,以往每个医院PACS的数据,医学影像数据是存在本地的。如果要实现医学影像数据在一个城市内的共享,建一个云存储中心,把PACS数据上传到一个地方,放在一个云上,就可以产生很多很多的价值。但其中就会碰到一个问题,数据怎么能够非常迅速地传到云存储中心来,一份PACS数据可能是几百MB,甚至是几十GB,如果不进行压缩,对带宽的要求就非常高,但要压缩,怎么样才能实现无损压缩?为此,浪潮在技术上创新和突破,实现了远距离的、海量数据、非结构化数据的无损压缩和高速传输。
场景化必然涉及到产学研用结合,所谓“场景共同体”。
谢长生指出:产学研结合很早就一直在提倡,但是真正做到一个很好的结合,还有很多地方要加强。早期的产学研合作还是一个比较低层次的,但是今天,一方面企业变的强大了,另一方面学术界也有很大进步,这必然会产出。
“现在我们的企业已经在国际上有很强的竞争力了,有些领域已经进入无人区,再往前怎么走,就要靠自己探路。这个时候我们企业和大学的结合是非常有好处的,因为学校它可能就是不断去探索前沿,看一些新方向,企业有大量的应用需求,他会提出很多真问题来。这样我们再一结合,这样比过去是一个更高层次的合作,这样就可以产生一些新的,甚至可以超越国外的产品,这样一个情况。我相信我们国家产学研结合可以走向一个更高的阶段,而且可以做出一些世界领先的东西,这个我们还是很有信心的。” 谢长生充满信心地说。
“我们浪潮跟华中科技大学在2009年合作了一个课题,叫超大规模海量存储,在存储体系结构上取得了一些突破,如怎么去解决容量问题、性能的问题、可靠性的问题,这些最终被集成到浪潮统一存储。这为产品创新、产品工程化、市场化、产品化商业运作奠定了一个很好的技术基础。” 李辉补充说。
“产学研做先行的探索,我们企业是来做接力棒的,我们要把这些创新和突破拿到我们的产品上,在工程界上去尝试、应用,把这些技术落地到产品上,最终能够到达我们的用户。“这是一个产学研应该有的循环。
产学研用的结合会触及到“异构存储“吗?
“当然了,异构也有很多种说法,一个是介质的异构,就是不同的介质,现在新的介质应该说越来越多,像英特尔有3D XPoint,我们现在也在跟长江存储合作做器件。这些器件一旦成功,我们就可以用到像浪潮这样企业的产品当中。但是没有一种存储介质能够做到又大、又快、又便宜,有的非常快但是很贵,并且做不大;有的是很便宜,但很慢,所以就需要异构融合。“谢长生回应说。
谢长生表示:这个系统里要用不同的介质来构成一个系统,使它总体呈现出来的是一个速度又高,容量又大,又比较便宜的这样一个虚拟的,看起来很大的这样一个存储系统。我想浪潮这种产品上面很多东西都是用的这种思想。
“我们跟华中科技大学的合作成果在浪潮第二代全闪存储就开始了,我们第二代全闪存储称之为HF系列,今年已经量产。其中就继承了这个合作的成果,实现了3D Xpoint与3D TLC NAND等几种介质的混合使用,带来了非常高性能和性价比。“李辉透露。
以场景化应用为代表会给存储带来哪些变化呢?
对这个开放的话题,李辉表示:场景共同体的产品定制会对产品带来什么样的变化,是革命性的、颠覆性的变化,还是说只是一些延续性的、局部的变化。从目前我们对场景的认识来看,它应该还是一个局部的,不是一个颠覆性的变化。比如车还是车,但是我这个车是园区里面用的车,还是说车站跟车站之间的这种大的公交车,还是说我的私家车,它可能会有这样的变化。
“不确定具体会有多少场景延伸,但至少我们可以看到两个极端的延伸:一个极端的延伸是往边缘和终端上走,所以在边缘计算这边会不会出来一些架构的重构、形态重构的存储。另外一个场景就是进内存计算,或者说这种高速的运行计算往内存存储这个方向,可能会有一些架构和形态的变化,可能会衍生出新的产品。“他说。
在这样一个共同意愿下,我们场景共同体有一个简单的想法,就是专业化分工不同大家在一起,类似一个圆桌一样,我们一个联盟一样,大家不是点对点,而是多点对多点,是一个全连接的交流合作方式,在这里面大家共同去解决这里面用户碰到的问题,用户碰到的技术问题、用户碰到服务的问题、用户碰到一站式整体解决方案交付的问题,我们在这里面用的是技术和商业的手段去解决问题。李辉进一步补充说。
谢长生认为:现在在很多场景上,像我们的CPU它就是一个通用性很强的东西,但是你要拿这个通用性的东西去解决有一些特定的问题,效率相比就会差很多。所以这种通用性和专用性的问题,这个就是看你的场景,我们还是说你的场景,你经常性的事件是什么,假如你那个经常性的事件主要就是快速傅里叶变换,如果它95%的时间都是要做这个的话,你用一个其他技术能比CPU要快得多了,所以它就是这个道理。就是取决于你的场景是什么,如果你的场景那个经常性的事件占的比率非常大。
不知不觉中,对话来到了尾声。场景共同体给存储产业带来变化才刚刚开始,让我们共同期待!