2017年,第四届中国闪存峰会上迎来了一位新进入国内的存储厂商先智数据,先智数据中国区总经理董唯元作为代表做了首次亮相,出乎很多人意料的是,在这场闪存存储盛会上,先智数据谈的不是闪存产品,而是可以服务于存储系统(当然包括闪存存储系统)的产品方案。
先智数据
对于先智数据(ProphetStor),国内的朋友可能会有点陌生,今年5月份,伴随着C轮三千万美金融资的到位,先智数据开始在包括中国北京在内的日本,欧洲,东南亚多个地区成立办事处,开始拓展中国市场,在笔者看来,未来几年将是中国存储市场对先智数据从陌生到熟悉的几年。
其实要了解先智数据并不难,先智数据是一家成立于2012年的存储公司,创始团队成员来自国内颇具知名度的存储数据保护厂商飞康(FalconStor),产品线首先就有灾备解决方案DR Prophet,另外还包括全闪存阵列StellarFlash,软件定义存储产品Federator,智能化的故障数据分析解决方案DISKProphet,一共四条产品线。
先智数据中国区总经理董唯元是国内知名的存储行业技术专家、资深职业经理人,是国内存储圈都非常熟悉的人物,在此次大会闪存的会上,董唯元出乎意料地没有谈及全闪存阵列StellarFlash,而是结合最热的人工智能技术应用,大谈创造性地用AI管理存储的话题。
当存储遇上AI会发生什么呢?
有人会想到,以后存储管理员就轻松了。如今的存储系统越来越复杂,功能越来越多,配置参数越来越复杂,数据越来越多,如何驾驭存储系统,并且如何保证数据不丢失,对存储管理员来说难度越来越高。人工智能的引入,使得管理员可以在简单的界面,基础的逻辑层面管理原本复杂的存储,用智能化优化存储运维流程。
这种改变的效应已经进入了日常生活,比如苹果Siri,微软小冰,还有谷歌助手这类语音助手,用户只需简单的语音操作就可完成原本需要若干操作才能完成的任务,比如,语音拨号,语音搜索等,人工智能在存储系统管理方面第一大作用是:带来优化的人机交互过程。对应到产品上就是先智数据的Federator。
另一大层面是人工智能可以在新的维度解决存储架构面临的问题,这点更具有突破性,多年来存储架构解决的核心问题是在保证可靠性和性能的基础上丰富存储功能,然而许多时候两者也是矛盾的,处理这类问题的传统做法已现疲态。
这一问题在传统高端存储系统方面尤为典型。董唯元认为,高端存储通常的做法是做各种限制,做一系列的兼容性测试,严格定义执行各种标准接口,来维护可靠性和高性能,此类做法适用于较为简单的存储系统环境,当软件定义存储等新架构出现的时候,传统做法已不能奏效。
从根本上来说,无论传统磁盘存储阵列,还是分布式存储,抑或其他形式的软件定义存储,随着规模的增大会影响到用户非常关注的可靠性问题,董唯元解释说,仅从概率计算便可以推断出:超过100块磁盘的资源池2副本已无法保证5个9的可靠性,当磁盘数量超过500的时候,3副本也无法保证5个9的可靠性。
为保证可靠性而做了多副本,所以可靠性与空间资源利用率互斥。类似的,可靠性还与开放性互斥,软件定义所强调的基础硬件不设限,虽然灵活开放,却为系统可靠性制造出很多麻烦;可靠性还与性能互斥,负载高峰时段如果磁盘发生故障,是否应该立即全速修复,这也一直是个值得纠结的问题。
传统处理方法的路越走越窄,先智数据创造性地采用AI来做存储系统自身管理,带来的最大的改变在于:让存储系统的故障处理策略由被动变为主动。一改以往出现故障之后的被动处理,变为先知先觉,预先做设置,提前防范,结合业务安排系统负载时间,降低意外故障对业务带来的影响,平滑过渡。
这种AI智能化相当于给系统请了一位经验丰富的售后工程师,这位全天候驻守的工程师经验老道,能发觉系统出故障前的一些征兆,能考虑多种系统运行状态,硬件使用信息,能处理诸如系统时好时坏怎么办,莫名其妙的小故障又是怎么回事儿这类情况。而且,不会犯普通管理员因为疏忽犯下的低级错误。
在这位经验丰富的售后工程师的帮助下,上文提到的磁盘数越多故障可能性越高,需要多副本来应对的情况得到彻底改变,原理是AI帮助记录每块硬盘的使用状况,预测准确率能达到95%(数据来自思科的测试)以上。董唯元介绍说,在该系统的帮助下,用两副本就可以支撑起千块盘资源池的可靠性。
闪存峰会不说闪存却说AI
演讲完之后,董唯元对笔者说:一位朋友刚发信息说,董老师您讲的很不错,但问题是,你跑题儿了啊,这是闪存峰会,你没说闪存啊。虽然闪存也是先智数据的产品之一,但董唯元则表示这是有意为之。
这得从先智数据的名字说起,先智的英文名字ProphetStor是希腊语中先知(Prophet)的意思,因为中国人的性格所致,不好高调地在名字中加入“先知”的字眼,所以就起名儿作“先智”,其实叫做“先智”也挺合适的,因为先智数据最大的特点就在于“智”,人工智能(AI)。
如上文所说,先智数据可以先知先觉发现需求,发现问题,通过机器学习来管理存储,在存储管理交互界面,在存储系统自身维护方面都带来很大改变,在日常存储负载的安排上,考虑如果某项业务在一定时间访问比较多,那么就在该时间点之前提前部署一些资源,从而提升系统资源使用的效率,非常的智能。
闪存峰会现场的话题大都围绕闪存,闪存的技术,产品,解决方案以及应用的问题展开。先智数据说的却是存储长期以来面临的大问题,之所以这样做是因为先智数据可以将基于人工智能的存储管理能力应用在友商的存储系统之上,先智的“智”既是面向最终用户,也还面向友商提供服务能力。虽然没有直接说闪存,但是他说的都是可以服务闪存的内容。
5月初,先智数据办事处刚刚落地中国,6月份,先智数据第一次把人工智能服务存储的理念推到了中国存储界面前。如果说一家初创公司为了找市场卖点赚眼球,而蹭热度聊人工智能,那不足为奇,但获得了包括与思科,Nutanix等知名企业的合作关系,则是一种来自产业界领先服务商的认可。
先智数据将如何立足中国市场
传统存储渐渐成为昨日黄花,存储的增长点来自闪存,软件定义和分布式存储,先智数据作为新公司,在新的增长领域均有所涉及。闪存,有新兴的存储阵列,在软件定义存储和分布式存储虽然没有直接做产品,但做了AI的增强引擎来强化此类产品方案,提升整体的可靠性和整体的资源效率。
先智数据的团队一部分来自原来的飞康,该团队善于做各种丰富的存储功能,先智数据对功能上完整性上非常有自信。另一个团队专门做人工智能,该团队出自台大,在许多国际比赛中曾多次取得奖项,在人工智能方面有很深的积累,负责训练AI引擎来支持存储。
“先智数据用人工智能的主动化机制做存储,目前没看到有竞争对手,这是我们希望能够赖以生存发展的关键,这个领域非常广阔,这是一个比较有规模的产业市场”。董唯元对笔者表示。
ProphetStor
先智打造出来的高故障识别率的人工智能预测引擎已将思科列为第一个大客户。而且,先智数据的产品适用范围比较广泛,既有除了BAT规模以外的互联万公司,也有许多企业数据中心客户。现阶段还没有太多行业侧重,发展的重心是建立生态,与许多行业伙伴建立合作关系。
先智数据不是以竞争者的姿态加入存储市场,未来将更多地凭借人工智能预测引擎拓展自己的朋友圈。先智数据计划与多个业内友商进行产品技术层面的合作,帮助他们优化产品体验,前不久,先智数据加入了超融合联盟,为的也是结识更多的朋友,在生态圈里接受意见反馈,找到合理的技术方案,做生态。