用户场景裂变,浪潮G5存储定制“一千零一个”新特性

背景:异域风情的古代王国、穷小子阿拉丁和公主的浪漫邂逅、可以实现任何愿望的神灯精灵……最近上映的真人版《阿拉丁》,让观众重温了一把儿时的童话梦。《阿拉丁》出自《一千零一夜》,后者顾名思义有N多个故事(确切说是264个),满足不同受众的兴趣。这与浪潮G5新存储类似,提供N多个新特性匹配各场景的需求,是存储里的“一千零一夜”。

用户场景裂变激发数据个性化需求

好故事多多益善,一千零一夜在童话世界里很美好。可在智慧世界里,数据存储真的需要大量的新特性吗?

这个问题可以从业务趋势的层面看,云计算、大数据、物联网、人工智能、边缘计算等新兴技术的快速发展带来了大规模数据量爆发,智慧转型与变革成为传统行业突破经济增长壁垒的主要手段。

云、数、智新技术的快速发展带来了数据的大规模爆发

拿人工智能来说,随着近几年的快速发展,人工智能已经从概念炒作,开始走向各行业的落地应用。国际数据公司(IDC)最新发布的《中国人工智能软件及应用跟踪》报告显示,2018年中国人工智能市场规模达17.6亿美元,在政府、互联网、金融、电信、制造、医疗等多个行业有较大规模的人工智能应用。人工智能产业化的背后,需要海量数据的“喂养”,这给数据存储带来了机遇与挑战。以医疗领域的肺部影像人工智能应用为例,过去平均一位医生每天要服务数十到上百位病人,涉及到1-2万幅CT影像图片,此外往往还需要对比病人既往影像,分析大量数据,而一般情况下,资深医生需要查阅、分析一位患者的影像数据需要10分钟左右,效率比较低。通过人工智能与新存储平台的结合,可以在数秒内完成对肺部结节的筛查,辨识度高达95%。

海量、多形态的新数据,推动了行业场景裂变

事实上,数据作为新数据时代的生产资料,推动了人工智能、云计算、大数据与各个传统行业的结合,为传统行业智能升级带来巨大价值。仅仅医疗、农业、金融和零售四个行业,就是新增千亿美元级的市场规模,云数智新应用在传统行业迸发出创新的火花,大量新场景、新个性化需求涌现出来。在交通/制造行业,出现了智能驾驶、智能交警、智能制造、智能机器等新应用场景;在通信/行业,出现了智能客服、视频处理、智能阅片、精准医疗等新应用场景;在金融行业,出现了精准营销、智能风控、智能投顾、智能定损等新应用场景。变化来得如此之快,就像GE全球董事长伊梅尔特说的,“GE昨天还是一家制造业公司,一觉醒来已经成为一家软件和数据公司了。”

浪潮G5存储:新特性服务新场景

在新数据时代,业务场景的更迭、裂变被变化中的数据所驱动,对于IT基础设施来说,需要不断改进产品特性或开发新的功能特性来匹配用户场景的变化,满足人们对数据使用及其价值释放的期待。

浪潮存储提出了“云存智用运筹新数据”的存储新理念,并认为,存储平台只有先实现了“灵活适配并满足云环境需求”、“支持并面向智能应用发展”以及获得“共享、管理及挖掘数据价值”的能力,才能支持并促进用户在新数据时代实现更多商业价值。

浪潮超大规模数据中心级分布式存储平台AS13000G5

AS130000G5是浪潮存储推出的一款面向超大数据中心级打造的分布式存储平台,以“5+X”架构承载数据中心多样化应用,满足多种数据存储需求,最大化挖掘、共享和管理数据,实现数据价值最大化。较上一代存储产品AS13000,AS13000G5在小文件读写性能、空间利用率、文件支持数量、智能运维预测等方面进行了全面的指标提升。

其一,小文件读写访问性能提升。在存储行业,所谓的小文件,是指容量不超过1MB的文件,云数智等新技术产生了海量小文件,这些小文件来自短视频类、图片、音频、消息、日志等应用,文件大小一般是几KB、几十KB、几百KB。通用的小文件高速读写性能在业界始终是讨论热点之一,各存储厂商不断存储池构造上以及工程优化上持续努力。小文件读写性能一直是存储业界讨论的热点问题,各存储厂商不断在存储池构造上以及工程优化上持续努力。AS13000G5在小文件聚合和对象聚合技术上进行优化,把多个小文件/对象转换成一个大文件/对象进行存储,将最小的访问单元从KB级转换为MB级,在随机写和小文件删除性能上带来大幅提升。基于对实际应用场景的分析,AS13000G5随机写性能可提升1倍,小文件删除性能可提高1.5倍。

其二,空间利用率提升。业界的分布式存储,空间利用率大多在85%,到此边界后,存储系统会自动警告,提示无法再继续写入,如果此时继续写入,当空间利用率达到90%、95%后,系统就会出现宕机问题。而AS13000G5,通过在多级一致哈希计算数据分布之间采用Map机制,将空间利用率从之前的85%提升到了90%,这样的提升意味着为客户提高了使用效率,同时节约了成本。

其三,千亿文件支持。AS13000G5平台支持上千亿文件数量,这背后是增加了支持变长元数据功能,在同样的缓存空间可以管理的元数据达到原来的3倍以上,结合对象聚合,使得同一个集群的分布式存储能够支持的文件数量从百亿达到千亿级别。这一新特性在卫星行业、交管行业当中起到至关重要的作用,千亿文件的支持,使客户的数据保存周期可以保存3年,并且理论上可以保存15年或者30年,甚至更长。

值得一提的是,浪潮存储还实现了人工智能运维。过去近三年时间,浪潮对50万个盘的运行日志进行分析、ML训练,实现AS13000G5的硬盘故障可预测,并且提前14天的预测准确率达到85%,同时硬盘性能提供1-90天的预测管理,这给用户带来的价值是可以从被动的硬盘故障维护转变为主动设计时间窗口,进行数据重建和维护,降低硬盘故障、性能问题对业务的影响。此外,设备上支持模块化易插拔,如在线分钟级更换硬盘,整个更换过程都具备智能化操作提示,避免误操作带来的风险。

目前,面向用户场景的裂变,浪潮存储不断打磨并提升产品特性,以便精确对接用户的各种需求。基于对应用需求的深刻理解,浪潮存储通过大量测试和验证,实现了不同场景下的解决方案优化。

场景化定制浪潮存储实力应变

浪潮存储在金融、通信、政府、交通、媒资等行业全面落地,进行了大规模PB级分布式存储部署,有实力、有经验助力用户推动智能转型。翻开浪潮存储的PB级大工程名单,可以看到:浪潮在成都智慧交通,支撑6000路视频流,提供了108节点、20PB容量;在广电总局部署了141个节点、10PB的云平台;在广电国网提供了150节点、10PB容量;在运营商的云化业务转型中,连续2年入围运营商分布式存储的选型和集采;在某资源中心,实现了中国最大的软件定义存储应用部署,提供270节点、70PB的空间,支撑资源中心的超高清图片存储。

浪潮存储服务行业用户,落地大量PB级大工程

大家知道,计算已成为新型生产力,浪潮聚焦智慧计算战略,提供服务器、存储、高性能、云平台、大数据等全栈IT基础设施。作为浪潮的重要主营业务板块,在这一充满变化的新数据时代,浪潮存储提出了“云存智用运筹新数据”的存储新理念,并整体升级了新一代存储平台G5。浪潮认为,只有先实现了“灵活适配并满足云环境需求”、“支持并面向智能应用发展”以及获得“共享、管理及挖掘数据价值”的能力,才能支持并促进用户在新数据时代下实现更多商业价值。