戴尔科技集团姜永凯:持续引领存储技术创新与发展

按:12月3日,由百易传媒(DOIT)主办的2019中国数据与存储峰会(DATA & STORAGE SUMMIT)在北京盛大开幕,与会专家对新一代关键存储技术趋势及数据创新应用进行了热议,大家一致认为数据智能将成为数字产业发展的关键推动力,驱动中国和企业数字化转型。

戴尔科技集团大中华区售前系统工程部解决方案架构师姜永凯

峰会首日,应主办方邀请,戴尔科技集团大中华区售前系统工程部解决方案架构师姜永凯发表了《持续引领存储技术创新与发展》的主题演讲。

以下内容根据速记整理,已经本人审定。

姜永凯:感谢百易传媒(DOIT)2019中国数据与存储峰会这个平台。我是姜永凯,在戴尔科技集团为企业级客户提供技术架构方面的支持。非常荣幸今天参会,也见到了非常多的新老朋友。我用二十分钟时间分享一些存储技术创新与发展方面的内容。

首先我们来看用户关心什么。我们知道,我们最终服务的是用户,做存储产业也是这样。在数字化的时代,用户在关心什么?用户关心的是自己的业务,关心业务如何更敏捷。IT的技术、存储技术的发展方向,都是为了实现用户的业务敏捷,产生业务价值。也就是帮客户的业务可以快速调整,用代码实现他的业务价值和他的业务逻辑,这也是我们的价值所在。

IDC总结了企业级IT的三个大方向。

首先是微服务化,微服务已经成为主流。大家一看就明白,因为微服务化和容器是帮助用户实现代码重用和代码敏捷部署一个重要的方向。IDC预计,2018-2023年,随着云原生工具/平台、敏捷方法、大量代码重用以及更多的开发者的出现,将有5亿个新APP面世,与过去40年间的数量相当。

存储如何去满足微服务化,如何从传统比较重的交付,变成能够快速迭代的持续开发/持续部署(CI/CD),再到开发运维一体化(DevOps),甚至未来讨论No-Ops,这是戴尔科技集团在帮助用户思考的问题。

二是多云部署已经成为主流。云帮助用户的代码交付实现更大的弹性,能够实现从边缘到核心到多云平台的部署。

三是人工智能能力不断扩展。数据的不断积累,在算法、算力的提升下,人工智能不是一个很远的话题,今天可能我们还在这里,是人工智能的第二阶段,包括智能工厂、智能制造,未来会更快的进入到前端,为什么?因为人工智能最核心的内容就是算法,算法是什么,刚才我讲了就是代码,就是业务逻辑和业务价值。人工智能也要求数据的高性能、高可用、高可靠,以及运维的自动化。

在这三点之外,我们还有哪些工具可以利用?可以看到,5G,IoT,分布式计算,区块链等等。这些代表了目前最热门的方向,要求我们把数据中心的管理模式从传统的方式变到了一个全新的模式。过去十年,我们把数据中心之外发生的事件和业务信息,拿回到数据中心里边处理和管理,未来的十年,我们会在事件发生的位置做实时的计算与处理。因为5G提供了实时交易和处理的能力,而人工智能可以帮助我们去做更好的算法训练,再把封装的算法推到边缘去做推理,利用传感器更多的感知能力,利用区块链技术可以跨组织和个人交易信息或者交易数据。

在新的模式下,数据存储与管理面临哪些挑战?随着数据量增长,大量的交易数据拿回数据中心处理。要管理数据的增长,打破系统之间的区隔,实现系统交换,往往需要重新建一个大数据云平台。另外,如果打破了这个区隔,那意味着所有”鸡蛋放在一个篮子里”,篮子一定要更安全更坚固。最后是释放价值,包括用AI算法,用以前比较熟悉的手段,如结构化数据上建模,未来还要关照IoT上边如何处理流式数据。

戴尔科技集团拥有七个子品牌,最核心的是三家公司:Dell EMC,VMware,Pivotal。在中国,戴尔科技集团未来将帮助客户提供一个数据中心转型的整体解决方案,这个方案可以从边缘到核心再到云解决算力部署和数据管控的问题。

戴尔科技集团的存储产品也非常丰富,行业内已经找不到一个存储厂商能够提供如此丰富产品线。为什么?因为我们所有的产品与创新都来自于客户的需求。就是今天,当你的代码在去做部署的时候,你有这么多不同的可用性需求、容量的需求、部署方式的需求以及数据格式的需求等等,这都是我们在关注存储的发展方向时的重点。

针对未来的需求,戴尔科技集团把数据中心的数据服务拓展到边缘,将今天的数据服务,数据中台,统一分析平台等等整合成一个统一数据服务平台。今天的技术能不能够衔接未来的产品?戴尔科技集团未来的产品就是要帮助客户能够无缝和上一代或更早的产品做集成。高端的PowerMax已经发布,中端应该在明年会有新的平台出现,名字还没有宣布,PowerVault也是已经宣布的产品,是我们低端的存储,大量边缘计算需要的临时存储,以及可用性要求不那么高的存储等等很多应用场景。如何把数据保护起来?我们数据保护的产品也有新的发布。

所有的这些平台,我们都是通过一个叫DNA的东西,也就是我们的技术储备,能够把客户需求和我们的解决方案联结在一起,这是我们在未来要关注的内容。有了这样的技术储备,还离不开大量的人才。我们在中国有2500+名研发的人员,帮助顺应客户需求实现产品的升级,这将是一个长达几年,跟着用户的需求成长的过程。我们在中国储备了足够的人员,甚至还在中国为整个存储行业输出了很多技术人员,行业内也有大量根据Dell EMC产品与解决方案去做研发的行业伙伴。所以我们看到,这是一个大的行业生态体系,这个生态体系帮助我们可以做更好的DNA,做更好的产品技术储备,创造更好的存储行业未来。

看一下,用户关心的另外一个话题是什么?

代码在交付的过程里面有不同的方式。企业级客户大多不是互联网公司或Startup的小白公司,都是在现有基础架构下面去发展应用,然后去满足未来数字化应用需求,在现有应用系统里有最传统的布局。以中航信值机系统为例,最核心的系统运行在大机上,未来看不到任何方式能更好地替换这个系统,同时开放平台要满足跟很多企业级客户平台对接的功能,要满足每个航班每个乘客的信息交互,实现的方式就是混合云平台。

混合云的概念不只是多个公有云,多个私有云的混合云,而是未来代码交付也会在裸金属主机、虚拟化、容器以及PaaS等云服务堆栈的多层提供交付的能力,这是多堆栈、多协议的云,多层提交IT服务能力的云平台。在这样一个多云环境里,戴尔科技集团重点关注如何去打造互通的能力,如何通过存储在底层把业务系统平台做互联互通,最终实现业务快速交付。

涉及到一些业务层面,企业级客户要满足大量的I/O交易,传统的存储包括核心存储如何去面对To C的业务转变,这方面有非常多的案例。存储介质的速度提升需要在存储系统上做整体的优化,才能让这种价值带给应用。商业银行为了应对双十一,应对新年红包,交易平台可以达到每秒钟2.5万次的交易,提升了交易平台性能天花板。

每一个企业级用户考虑数据中心布局的时候,首要的问题是担心有没有足够的空间,有没有足够多的电力,这个时候要考虑的是存储能否做线内的除重和压缩,同时不损伤应用的性能。这个将是存储很关键的一个能力,因为应用在损伤性能的情况下做除重和压缩没有任何价值和意义。

今年9月17日,戴尔科技集团成为业内第一个存储系统里使用双端口的傲腾介质,就是在应用性能得到五倍提升情况下,大幅度降低机房的消耗和电力的消耗,解决了企业级客户机房面临的确实问题,也实现了戴尔科技集团的社会责任承诺。

这种情况下,除了性能的提升,也包括介质的利用,我们都知道存储级内存(SCM)价格很贵,每TB是普通NAND闪存价格的十倍,用户更关心怎么把介质用好,这里有一个一九原则,百分之十是经常访问的数据,需要更高的应用性能,而在互联网+时代之后或者说数字化2.0时代,用户关心的是提升性能的天花板,减少数据摆放的人力消耗,用人工智能让机器自动去做,我们的PowerMax也是第一个在业内高端存储里部署了人工智能的算法。每一天实时分析预测4000万个数据单元,是选择SCM存储介质,还是选择传统NAND介质,机器可以通过算法帮助优化,每一天在一台设备里可以做60亿个智能决策,移动这些数据单元。这样的存储才可以帮助客户应对调整所消耗的人力资源增长需求,未来会有更多的越来越智能的设备工作在数据中心,应对数据性能和容量的挑战。

此外,现在很多用户也采用多云的环境,当然不是多云的堆栈,这里是指私有云和公有云之间的互联,实际情况是,最底层的虚拟化层(Hypervisor)都完全不同,怎么样打通多个公有云之间的区隔呢?戴尔科技集团将在多云的堆栈,在代码需要部署的层面联通多云,利用原生的容器和虚拟机统一管理做应用的交付。在底层提供更灵活的选择,通过传统三层架构的存储,或通过超融合的方式,自服务获取底层的基础架构。

多云基础架构最大的特点是,用户今天可以和腾讯、阿里、AWS、微软、IBM等,几乎可以找到所有的主流公有云服务商,都会有一个VWware的专区,这个专区和用户的数据中心之间可以无缝的互通,然后通过虚拟机无缝的迁移,不需要停机,这样的多云平台可以帮助客户更好地实现代码交付,利用公有云实现更大弹性。

这里边包含了云和数据中心之间的互通,边缘到数据中心之间的互通

也包括了如何保护所有在边缘、在数据中心、在公有云多云平台的数据。

未来在物联网的环境如何交互处理数据?

要把数据取回数据中心只是做训练,边缘一定是一个小的算法或者是压缩成模块的算法,可能是通过FPGA去部署,数据中心里是大数据量通过GPU、TPU去做训练。这个平台最大的问题是什么?无论采用现有的什么手段,比如用卡夫卡把数据采集进来,不管是到数据湖还是数据服务平台,最重要的是数据一旦写入系统,现在无法避免它的移动和拷贝,只要移动和拷贝就会产生数据副本,产生数据副本就会有管理,有数据一致性的问题。通过卡夫卡,并发有限制,实时处理有限制,数据的分析处理要通过ETL加载到某一些分析平台上面实现,也无法满足未来在边缘做实时的推理,这是一个非常大的问题。

流数据本身还存在管理的问题,对数据副本进行管理,对应用前端的管理,这里也有孤岛无法打通。

戴尔科技集团历时两年研发的Naultilus项目的Pravega分布式流存储平台,会帮客户把数据注入和数据持久化统一在平台上面,只要写入到数据平台,就减少它的移动,用Isilon+ECS存储架构实现持久化保存,利用Flink平台(目前属于阿里集团)做流数据的计算处理,我们继续合作在做一个统一的流数据分析的引擎,结合在一起减少数据的移动、减少数据的副本,增加数据管理的一致性,满足实时分析处理应用的要求。

2018年,戴尔科技集团的外部存储取得了长足的成长,同时软件定义、超融合相关业务也在进一步增长。

我们不但引领了这个行业,也把一些最新的技术带到这个行业里边来。

今年戴尔科技集团和IDC联合撰写了一份白皮书,提出了第五代存储概念,指出了未来存储的五大特性,包括敏捷高速、有效容量、无缝接云、数据护航、AI赋能,以及如何帮助用户利用第五代存储的特性实现数字化转型,这次两天的会议中还安排了SCM和第五代存储的专场,也请大家关注。

未来,戴尔科技集团将持续在存储上在中国加大投入,谢谢大家。

戴尔科技集团大中华区售前系统工程部解决方案架构师姜永凯

编后:本次2019中国数据与存储峰会(DATA & STORAGE SUMMIT)为期两天,包含主论坛、CIO高峰对话,以及大数据、闪存系统、分布式存储、第二存储与容灾备份、超融合与云存储、人工智能、数据创新与安全可控、容器创新与应用、SCM第五代存储与闪存控制器等十大主题论坛,超过100场的专业知识分享。初步统计,本届峰会吸引了来自政、企、产、学、研、媒体等各方参会者约2000人,在线直播观看观众再创新高,超过10万余人次。