三大举措定义下一代存储,阿里云智能释放云时代数据智能原力

6月9日,2020阿里云峰会在网上举行。

在以“面向未来,企业CIO该懂的数据经济学”为主题的演讲中,阿里巴巴研究员、阿里云智能存储资深总监Alex介绍了阿里云对数据经济学、数据价值、以及数据带来的挑战和机遇,并且对阿里云存储目前所做的工作和在未来的战略方向进行解答。

图:阿里巴巴研究员、阿里云智能存储资深总监Alex

数据的爆炸式增长,催生数据经济快速发展

当下,任何一个传统企业应用本身产生的数据的增长,并不是爆炸式的增长。但企业并不能只看到本身应用所产生的数据,同时也在关注社交媒体以及机器产生和人产生的数据。Alex指出,人产生的数据,包括拍照,视频等的增长速度,是企业级应用产生的数据增速的十倍,而连续24小时不间断运作的机器,诸如物联网、传感器所产生的数据的增长率则是50倍以上,二者所产生的数据也都是不可控的,这也意味着,企业要管理本身的数据的增长之外,还要联合应用外部非自己应用产生的数据的增长。

这势必会遇到很多的挑战。

“数据是新石油,潜藏有很多的价值”已经成为业界的共识。Alex认为,数据的价值是两极化的。

首先,一个数据产生的时候,也就是某一件事情发生或者触发的时候,可能会引发一些洞察,根据这个洞察可以做出一些商业上的决定或者推荐——当一个客户走进一家商店,这个时候对他的一些洞察,或者给他的一些推荐,在他离开这个商店之前都是有效的,但当这个顾客离开商店后再做这样的洞察或者推荐就失效了。

显然,可见的洞察、实时的分析带来的可操作性以及决策潜藏巨大的商业价值。

其次,长期累积的数据可以有助于展开探索。比如说,今天下雨是否会跟喝咖啡有什么关系?想要了解其中是否隐藏了某些规律,这些规律是否会改变商业模式?这在当时并没有答案。但当数据累计到一定的规模,通过一定的探索和分析,可能会得出意外的结论——没准下雨跟喝咖啡之间真的存在某种关系。在这个时候,数据就带来了更多的价值。

在Alex看来,数据的价值两极化是毫无疑问的,但在不同的情况下,数据对存储的挑战就不一样。

数据的存、管、用

数据是一种特殊的资产。作为资产,数据也离不开三个字:存、管、用。

在“存“方面,因为数据能产生价值,所以它具有长期保存的必要性。但是数据累积会越来越多,这样的话,如何用同样的资金去从存储更多的数据呢?这是一个比较大的挑战。同时,硬件设备肯定是有寿命的,也会出现故障,如何能够保证数据不会因为硬件的损耗而带来任何的影响?

在“用“方面,由于企业的业务都是7*24小时,所以数据要能够随时被访问,即使在某些区域型或者机房发声灾难的时候数据仍然要同时能够被访问,不然的话就会影响到核心业务。另外,数据有的时候还需要快速地访问,比如实时查询,又因为大数据分析的需求要对数百GB或者TB级的海量数据实现秒级的访问,这些对存储都是不一样的需求。

在“管“这个方面,数据的增大带来了很多管理上的困难,不少企业在各个国家各个区域还要去遵守当地的行业合规,做好数据保护、数据脱敏的储存等规则,同时还要防止误删除操作,防泄漏——即使数据被人偷走也用不了,妨害要访黑客、防勒索软件等等。

带来了查询、精准化去判断和定位所需要的数据再进行调度,给所有企业和个人都带来了巨大的困难。

为什么选择阿里云和阿里云存储?

为什么选择阿里云?为什么选择阿里云存储?

阿里云有与众不同的四大优势。Alex对此一一解答。

首先,阿里云存储基于盘古飞天底座,一个十年磨一剑自主研发的存储软件平台。这个存储软件平台跟其他厂商不一样。其他很多云厂商只是提供了服务,但并不是自己在用,而盘古飞天是承载了整个阿里巴巴经济体的、通过了全世界最压力最大的“双11”的压测打磨的一个存储平台。

其次是阿里云在全球各个地都有布局、存储规模数大十EB级的可用区,每天有上万亿级别的请求次数。如此丰富的资源,既充足满足用户的需求,同时也为客户提供了一定的弹性。

第三,阿里云的存储产品深受国内外客户信赖。在国内,有接近200万家客户采用阿里云,大量海外的客户也将在核心数据存储在盘古平台。其原因,主要是在技术上面得到了认可:除了有全链路加密,包括从on premise线下加密,到传输和落盘,同时也通过了各方面的行业认证,所有相关资源、操作等日志也都可被客户去访问、审计,所有的操作都是合规的。

“通过大量的努力,阿里云的解决方案,阿里云存储的产品和技术获得了海外的和本地客户的信赖。”Alex说。

第四,阿里云存储有着丰富的产品线,除了公共云产品,还有专有云、混合云产品。很多存储厂商只是提供线下的存储产品,却并没有强有力的公共云产品;也有一些厂商,他们专做公共云的产品,但是并没有线下企业级存储的产品。阿里云既有公共云、也有专有云或者混合云,具备完整的存储产品线和数据密集型的解决方案。

对用户而言,有可能全栈上云、也有可能部分的上云,比如备份上云。无论什么时候阿里云都可以提供支持——从现有架构嵌入无缝上云,到未来某一天全栈上云,阿里云存储整套的产品和解决方案完全匹配,伴随着客户一直的上云旅程;成为客户最佳的合作伙伴。

三年来,阿里云存储的规模已经翻了十倍。

图:阿里云存储丰富的产品线。

定义下一代存储,释放云时代的数据智能原力

谈到未来发展规划,Alex认为阿里云存储核心目标是三个。

一是全闪存;云激活全闪存的极致性能。

全闪在存储在业界已经讨论了十年。Alex表示,全闪存技术只在云上才能够真正极致的发挥。

原因在于全闪设备十分昂贵。如果用户为了少量的数据购置全闪设备之后,需进行低延迟的加速,配备较大的存储硬件设备并加以维护,在线下这种传统的架构还离不开网络的优化;为了进行冗余,还要配备第二个全闪。而在公共云上,就不存在这些问题,因为阿里云对网络和计算的链路都进行了优化,阿里云的SLA,各项性能指标可以针对单个的卷去提升速度,同时ESS产品可以去升级线上的IOPS,大大提升性能。

“全闪技术跟云的结合,会让全闪技术得到极致的发挥。”Alex表示,这是阿里云存储的第一个目标。

二是普惠世界50强的企业IT架构。

可以说,所有世界50强企业的IT架构都是非常Rubust的,也就是非常高可用、高安全的,原因是他们实现了主机备份,包括同城冗余、两地三中心的架构。通常情况下,要搭建这样的架构,除了购置大量的基础设施,如服务器、存储、机房、土地等等,还需有大量专业的运维人员,成本高昂、维护复杂。但在公共云上,这些功能都搭建完毕,阿里云借助各个大区的数据中心,可以针对需要的卷去跨区域复制、快照,或者OSS等等,低成本、简单地实现类似于世界50强的Rubust的IT架构。

第三,数据引力下的存储。

数据越来越多,移动数据就变得越来越困难。首先离不开大带宽,其次,每次都有可能会泄露或者是误删操作,风险很大。为了避免这些情况,阿里云存储决定做好数据引擎,将计算的能力下沉到数据中,对数据进行就地计算,然后交付结果,或者一份数据就可以被多个计算引擎或大数据分析平台用来分析。阿里云的技术突破,包括将FPGA与存储空间相连接,实现对图片的就地处理;又如OSS跟EMR  Data analytics一类的大数据产品实现集成,改变云存储的格局。

数据的爆炸性增长带给全球带来了很多新的挑战。

“因为数据中心的规模、计算的可靠性、安全能力和存储产品的完整性,以及对前瞻技术的掌握与应用,是阿里云存储成为客户首选的原因,也是阿里云高速成长、成为目前国内市场规模最大的公有云的原因。” Alex表示。

“安全稳定高性能,普惠智能新存储”。这应该是对阿里云、阿里云存储最好的注解。