2017年12月5日,以“中流击水,浪遏飞舟”为主题的中国存储峰会在北京召开,会议由DOIT传媒、存储在线和中国计算机学会存储专委会联合主办,全天四十场+论坛演讲,众多业界大咖轮番上台,深入解读中国及全球存储市场现状及发展趋势,吸引了来自政、企、产、学、研、媒体等各方参与者超过2000人,观看在线直播观众超过7000人。
在下午的分论坛四中,紫光西部数据有限公司高级产品经理田成先生发表了《创新闪存,以全致胜》的主题演讲,具体介绍了创新的闪存如何创新,以及创新闪存的应用场景有哪些。
紫光西部数据有限公司高级产品经理田成
以下为嘉宾演讲实录:
这是一个数据大爆发的时代,人工智能,AI,包括现在增强虚拟现实都是比较新的技术,Docker最近炒的非常火,因为它很有可能取代现在非常火的虚拟主机技术,当然这只是大家的一个想法,但目前来看虚拟主机在主流行业当中还是占据非常主导的地位,那Docker凭什么能够取代虚拟主机,这个是值得大家思考的问题。
我的体会是它作为一个新兴技术是怎么样充分满足用户新需求,我们就先说一下虚拟主机,大家都很熟悉,你买一台物理主机,安装相应的一些软件,就可以把这台主机虚拟成多台虚拟主机,你会在不同的虚拟主机上不同的OS在上面,这就是虚拟主机的概念。但是Docker完全颠覆了这个概念,大家在同一个物理主机里面共享OS(操作系统)层,这样可以给客户带来几大好处,第一OS层省掉了,我启动一个Docker,它的速度就变得非常快,以前启动一个OS速度是分钟级,对于Docker来说它是秒级启动,我在给一个用户部署一个应用的时候,几乎是不需要花时间,就能够把这个应用完全启动起来。这个技术带来的,我们现在有个中文名称叫容器技术,容器技术给大家带来的改变是非常巨大的。
一些比较大型的银行业,他们现在已经非常深入的在研究容器技术,其中最主要的就是Docker技术,研究这个容器技术的时候把握了几个点,如果大家做过传统银行业务,你会发现它的运营部门和开发部门是两个完全独立的部门,两个部门之间会有一个沟通的桥梁,如果这个沟通桥梁做的不好的情况下,这时候开发速度也好,上线速度也好都会变得非常非常缓慢。
我们知道一家传统的银行系统至少都是一个上百级的应用,如果我们在上百个应用里面,每一个应用开发速度都是以月为周期作为单位的话,那这个开发进度是不可想象的,所以银行业决定变革,怎么变革,他们充分运用新的技术,新的容器技术或者新的开发理念能够加快从开发测试到上线的时间和速度,我之前的一些经历表示,一个新的系统上线现在已经缩短到以周或者以天为计算单位,这种变革实际上是发生在我们每一个人的周围,大家都是做IT的,也都是做存储的,这种变化我们生活当中已经非常深刻的领会到了。
我之前还做过一些项目,比如跟智能工厂,智能物联网相关的比较大型的项目,这些项目的共同特点跟我们过去的想法完全不一样,过去是什么想法呢,我按一个订单,比如我生产汽车,这个汽车我生产出来什么颜色,用户就只能购买这个颜色,现在汽车生产方式已经变成了订单化的生产模式,我要什么颜色会生产出什么颜色,我们能够不停的发现数据的变革,也是用户需求的变革,这就是我的主题,这是一个数据爆发的时代。
既然有这么大量的数据存在,必然就会有一些数据是快数据,什么叫快数据,交易类型的数据,建模数据,智能工厂的数据,这些快数据对数据的要求就是IO的速度一定要快,它的性能一定要高,它的延迟一定要低。有快数据的同时还会有一些温数据或者慢数据,什么样的数据是温数据或者是慢数据呢,比如说我们要做一些分析,要做一些预测,要做一些合规的数据,这个数据我们叫慢数据或者温数据,这个数据的特别就是容量非常高,高容量的数据。所以我们现在的数据业务特点从我现在的归纳来看主要分为两大块,一个是对性能要求很高的数据,一个对容量要求很高的数据,看似是两个矛盾的东西,我们能不能整合在一起,这是我们今天要讨论的重点话题。
刚才提了数据的多样性,我们来看一下不同的数据介质能够带来什么样的结果,我们的CPU,有缓存一二三级,这个CPU是作为数据处理终极介质,处理速度非常快,是以纳秒级的速度处理。这个是我们常用的内存还有NAND的存储介质,容量比CPU高一些,但是速度降低,以毫秒级为计算单位。再往上就是FLASH,我们已经能做到7.68TB,这个容量已经非常大了,以至于我们现在普通的HDD可能都比不上,最后就是我们普通的硬盘,它的容量是逐渐上升的,速度是逐渐下降的,成本也是逐渐下降的,我们对数据不同的介质给我们带来的好处是不一样的,怎么通过不同的介质最终使整个系统有效的运行下来。
我们就需要考虑几个话题,一个就是存储介质的性能是不是足够好,有几个指标,IOPS、延迟和带宽,作为存储最基本的指标我们应该了解,这个数据存储设备是不是能够满足性能的要求。
第二点就是可靠性,因为我们知道做数据存储最关键的就是可靠性,我们有没有相应的内存的保护机制,缓存如果失效了,我们是不是能够把缓存的信息及时的保存下来,有没有双活的架构,你的架构设计是不是双活的,一个控制器失效,另外一个控制器是不是能接着工作。第三有没有一个完整的数据完整性的保护措施。然后是效率,我们都会关心数据精简,元数据加速,应用程序集成,统一管理,第四就是特性,你这个存储设备是不是能够实现多协议访问。最后一点就是你这个存储设备是不是具有足够的经济性,是不是够便宜,是不是能够买得起,你的介质是不是具有自适应的特性,这些都是我们对一个存储系统所需要关注的几个点。
一款存储设备,是内存优先的一个存储架构,我们数据在读取的时候,是优先把数据存在内存里面,那怎么在内存里面对数据进行处理,这是我们非常关注的一个话题,我们后面会有详细的解释。再往下存,就是我们刚才提的flash硬盘还有普通的硬盘,这几者之间是什么关系,我们数据进来以后首先经过内存,然后经过非适应性内存,DRAM在这里面起到什么作用,一旦缓存的数据失效了,它能够有效的保护或者保存数据,这个也是我们西部数据的一个创新点。
怎么做到极速性能提升,我们来看一下,左边这个是传统的存储设备,两个完全混杂在磁盘里面,这样有个问题,使整个IO访问速度非常受限,右面是现在我们做的。刚才提到了企业特性,就是我们作为存储系统常用的在线压缩和重删,在我们紫光西部数据里面,压缩和重删有一点不一样,数据进来之后首先进行在线的压缩,直接在内存或者缓存里面做压缩,压缩以后再做重删,重删的数据还是保留在内存里面,通过数据精简提高整个缓存或者闪存利用率,我们数据进来以后首先就能看到有哪些数据被保留下来了,能够实现整体的数据性能的提升。
这个是应用在不同的应用场景,有非结构化数据,还有一些消息、社交、虚拟化、桌面、分析、交易之类的,所有的这些应用都可以通过这一个设备实现。为什么能够实现,是因为它有非常丰富的企业级特性,有全面的数据完整性,有元数据加速,有智能的缓存,有通过简单的滑块实现硬盘的对比,还有多协议的数据访问,因为它可以支持非结构化数据,一些最基本的闪存系统的功能我们都有。
谢教授是专门研究闪存持久性的,大家知道闪存是有寿命的,什么样的情况下我们能够使闪存的持久性保存的更好,肯定要用一个非常先进的算法来实现,这个算法就是我们现在OS的核心,可以采用大数据块写入的方式,或者顺序的写入方式,实现整个闪存长久的使用。上午有的厂商提到我们的闪存可以使用100年,我也可以承诺我们闪存的持久性可以达到100年。
我们承诺数据缩减达到4:1的比例,这个是史无前例的,全闪和混闪都有,这个不是所有厂商都能做到的。第二个我们能够承诺全闪性能达到或者接近100万IOPS,时延能够达到0.1毫秒。这个是我们实验室的实测数据,所以我们也敢在这个地方给大家做一个承诺。全承诺,真赔偿,我们不是做广告,我们是在这边会有一个正式的承诺给到大家,如果有合作伙伴或者是厂商对这个承诺感兴趣,可以直接找我们销售,销售会告诉大家怎么做这个承诺,怎么做这个赔偿。
上午胡总也发布了一个新产品,其实就是基于NVMe新的全闪存储产品,我在这边强调一点,我们在NVMe全闪存储里面我们是第一家可以支持统一存储的,我们支持任意的结构化和非结构化数据。第二点我们是统一的软件平台,我们的NVMe这个平台跟普通的平台用的是同一个软件,也就意味着用户使用起来的时候不会感觉到任何不方便,因为它的使用习惯完全都是一样的。最后一个很重要,支持企业级全特性,刚才提到的克隆、快照、复制之类的所有的企业级特性在我们现在这块全部都能提供。紫光西部数据在一年之前成立这家公司,最早的目的就是能够把世界上最先进的存储和磁盘产品带给大家,所以我相信一年以后我们也会秉承这个理念,能够把最新产品和最新的技术带给大家或者带给合作伙伴,或者客户。最后,紫光西部数据我们虽然是一家新成立的公司,但是我们是一家具有开拓性和创新性的公司,我们希望通过这款创新的闪存系统能够帮助客户全面实现业务转型,谢谢大家。