2023闪存峰会上,存储介质厂商、闪存控制器厂商、固态硬盘厂商和闪存存储系统厂商可谓是争奇斗艳,各领风骚。过去十年以来,整个存储系统的很多创新都围绕闪存和软件定义两大要素来展开。而在2023年,戴尔又多次强调软件在驱动存储创新方面的重要性。
硬件大厂的创新为什么要靠软件?
按小编的理解,尽管很多苹果手机的硬件规格(如内存大小)不如很多 Android 手机,但由于 iOS 系统的软件优化,系统流畅度往往更好。硬件固然重要,但优化良好的软件驱动才是提供持续高性能和稳定性的关键。这也是为什么英伟达显卡在实际应用中往往比其他同类硬件表现更好的原因之一。
作为一家大型存储系统厂商,戴尔科技一直在做的,就是用软件能力把硬件的能力充分发挥出来,帮助企业把数据存储好、保护好、管理好、优化好、利用好。为了做到这点,戴尔每年在研发上的投入高达几十亿美金,光是过去三年,研发总投资额就高达79亿美元,大部分都花在了软件创新上。
从戴尔科技集团大中华区存储平台及解决方案事业部总经理刘志洪的介绍中了解到,戴尔全球几万名研发人员当中,有85%都是软件工程师,另外15%的硬件工程师,在日常工作中30%到50%的时间也在写代码,写硬件驱动程序。
如此说来,像戴尔这种大型存储系统公司,虽然貌似硬件公司,但其核心还是软件。毕竟如今存储硬件标准化的趋势不可阻挡,控制器的算力越来越强,闪存的性能也越来越高,存储系统自然更需要在软件层面下功夫,不断提高效率、可靠性、数据服务等。
从刘志洪的介绍中了解到,存储本身其实非常复杂,存储系统里动辄上百PB的数据容量、每秒千万级的读写操作,如此指标下,想要让存储系统持续高效平稳地运行还是很有挑战性的,它非常依赖软件的不断优化。近几年来,戴尔开始深度利用人工智能技术来优化存储系统。
在系统层面,戴尔用人工智能、机器学习技术来分析每个读写、交易行为,把正确的数据适时放到正确的位置,以此来提高存储效率,配合对数据进行压缩,对部分重复数据进行删除的操作,戴尔对用户承诺很高的数据压缩比。
在集群层面,管理工作涉及服务器、网络、应用等多个方面,本身非常复杂繁琐。戴尔的人工智能技术CloudIQ AIOps 可以提升运维管理效率,从而帮助用户更早的发现问题,提前做规划,这种人工智能技术可管理戴尔包括存储、服务器等多种产品在数据中心的部署。
现代化存储除了要有闪存,还要有如下这五大支柱
云计算、大数据、互联网技术兴起的十余年,也是技术创新爆发的十余年,企业存储系统也因势而动,开启了现代化的征程。
刘志洪提到,七年前,戴尔提出了现代化存储的四大支柱,如今发展为六大支柱,这六大支柱代表了戴尔存储当前和后续的研发方向。
如果非要在其中圈两个重点,我个人觉得,闪存和软件定义是过去十余年来推动存储发展的两个最关键因素。在2023闪存峰会现场,刘志洪也着重介绍了戴尔在“全闪设计”上的发展历程。
EMC(2015年戴尔收购了EMC)早在2008年就开始在企业级存储系统中大量使用闪存,起初主要是将闪存当做大容量缓存来用。闪存的加入使得存储系统的性能有了大幅提升。由于闪存和磁盘的调度管理方式有很大差异,此时算是闪存应用的初级阶段。
2012年,一家成立于2009年的以色列闪存初创公司吸引了EMC的注意,EMC以4.3亿美元将其收入囊中,它便是XtremIO。2013年,XtremIO开始正式发布产品,2015年就做到了十亿美元以上的年销售额。
为了抢占闪存存储的市场先机,EMC在2014年又斥重金收购了另外一家闪存初创企业DSSD。DSSD的首款产品发布后,其千万级的超高IOPS、超低延迟和超大带宽在当时成为绝对领先的性能王者,但缺点是当时闪存介质的成本还居高不下,限制了该款产品的广泛使用和市场发展。
这些收购推进了EMC在全闪存存储阵列上的技术演进。2016年,Dell EMC系列继续将包括XtremIO和DSSD的技术拆解并融入到了新产品当中,一开始主要用在高端存储VMAX上,随后戴尔几乎所有的产品线都有了全闪存的配置,仅非结构化存储部分保留了混闪的配置以适应超大容量非热点数据的存储管理。
EMC曾经提出2016年是全闪阵列元年,并预测到2022年所有企业的核心应用都会跑到全闪存阵列上。刘志洪表示,这一预测在戴尔的主要细分市场已经实现。目前全球市场全闪存存储系统的部署进度快于中国大陆市场,但他认为中国市场很快会迎头赶上,预计两年后,中国企业用户也都会将核心业务跑在全闪存上。
刘志洪表示,单单纵向扩展显然不符合今天数字化时代的业务发展需求。因为,成熟的企业或者创新企业都会不断尝试新的业务,业务上线初期对应的投资会相对较少,如果新业务走向成功,自然会对IT资源进行扩容。
在横向扩展系统的支撑下,仅用几台设备就能搭起支撑创新业务的系统,如果业务不成功,成本也相对可控,如果业务成功则可以快速扩容系统。反之,如果是纵向扩展系统的话,想要不断扩容则会非常麻烦。
戴尔旗下的PowerScale是一款横向扩展的NAS文件存储系统,支持从三个节点起步,能够轻松扩展到几百个节点。而基于软件定义的PowerFlex分布式系统扩展性更强,支持从四个节点扩展到上千个节点,是承载高价值应用、多云平台的优选架构。
如刚才所说,“软件定义”是另外一个重要趋势,包括CPU和闪存以及网络等硬件性能的不断提升,为软件定义存储的发展打下了坚实基础,戴尔旗下基于软件定义的存储产品也越来越多,包括上面提到的PowerFlex分布式多云平台。
在公有云、私有云、混合云并存的时代下,“多云架构”已是企业的必然选择,戴尔也在致力于将旗下的存储向多云的架构方向演进。
“数据保护”的重要性随着数据价值的提升而不断提高,戴尔有专业的备份解决方案、异地容灾解决方案和针对勒索软件的Cyber Recovery解决方案,BR、DR、CR三位一体可以全面保护企业的各种数据和基于数据的业务系统。
最后,在IT资产越来越多,业务规模和类型越来越复杂的当下,包括存储和服务器等系统的管理越发复杂,很多企业在管理运维方面加入了“智能洞察”能力,从而提高运维管理效率。
继往开来,其实,戴尔存储系统中的软件一直提供着最为重要的数据服务的核心价值
无论是以前EMC时代,还是现在的戴尔科技新时代,这家老牌存储厂商的市场成就都与软件创新息息相关。
戴尔高端存储PowerMax的前身就是大名鼎鼎的Symmetrix,它发布于1990年,是那个十年当中,EMC高速发展的主要原因之一。
2001年911事件震惊全球,然而,受事件影响的企业因为采用了Symmetrix系统,还有系统上的SRDF(Symmetrix Remote Data Facility-远程数据复制)、TimeFinder软件,数据的完整可用和业务连续性得以保持,业务没有受到影响。经此一役,Symmetrix再次名声大噪。
后续发展中,Symmetrix又从DMX、VMAX发展到了如今的PowerMax,名字虽然变了又变,不变的是,它依然承载着全球大多数大型企业的关键业务工作负载和数据,是稳态IT系统的典型代表。
同样负责关键任务工作负载的还有PowerFlex,它被戴尔称作是终极的软件定义基础设施解决方案。
PowerFlex是基于x86架构处理器而打造的,融合了存储和计算能力的集成系统。它有超强的可扩展性,可以不受限制地进行现代化升级,适用于处于现代化进程任何阶段的客户。它可灵活部署在多个环境中,凭借高水平的自动化管理功能,降低本地和云这种混合架构的管理负担。
PowerFlex 从头开始设计,可以向要求严苛的关键任务环境大规模交付一致的可预测结果。它针对很多经验证的工作负载解决方案进行了优化,既包括传统的关系数据库,也包括现代云原生 NoSQL 数据库,还包括吞吐量密集型分析工作负载。
当然,关键业务负载只是企业业务构成中的一小部分,相比之下,中端存储更适合大部分用户的大部分场景。
我们看到,戴尔发布的PowerStore延续了PowerMax在存储效率和可靠性等方面的优势,在性能上也不断提升。PowerStore的创新重点也在软件上,基于容器化的原生设计,打造自适应性架构,在功能性上也有独到创新,比如,直接从PowerStore用户界面配置完成备份到PowerProtect设备。
自PowerStore发布以来,PowerStore的每次更新动态都离不开对PowerStoreOS新版本的介绍,从上图可见,PowerStoreOS的更新版本还是挺快的。而且,由于采用的是自适应性智能架构,所以,用户可以比较放心大胆地进行更新,而无需担心业务中断的问题。
非结构化数据的爆炸式增长,让戴尔将原来的Isilon系统改造升级为PowerScale,两者都将Isilon OneFS作为其操作系统。OneFS作为核心操作系统,在确保存储系统高效、可靠和易于管理方面扮演着非常重要的角色。这里,再次凸显了软件部分的重要性。
作为典型的非结构化数据存储系统PowerScale,它可以广泛应用于非线编影视制作领域、生物医药的基因测序场景,以及油气勘探、气象遥感、人工智能、自动驾驶等领域。
结束语
从软件创新的视角看戴尔,戴尔不仅能用软件释放硬件的性能,打造端到端的基础设施解决方案。而且,对于用户在云计算、多云架构、边缘计算、人工智能等新型技术趋势方面的需求也都会有更强的适应能力,换句话说,戴尔的软件驱动型存储系统及其技术方案是面向未来的现代化数据基础架构。