云计算埋葬阵列?达沃时代用新融合架构叫板EMC

作为EMC引以为傲的两大产品线,VMax、VNX虽然如今光芒不及XtremIO,但说它们要死掉你信吗?如果分布式存储也有了企业级特性呢?
VMax、VNX的首字母V代表它们和VMware的深度融合,由于VMware在云数据中心市场的地位,EMC认为,这种融合足以让它们的性能和容量在云基础架构领域甩竞争对手好几条街。几年前这话是没错,然而如今VMax、VNX所在的部门已经与DPAD合并,而VMware则面临激进的投资者施加的分拆压力。目测Joseph M.Tucci时代结束之后,EMC何去何从还是未知数,而挑战者越来越多。此时,有一家刚刚创立4年的中国公司,唱响了VMax、VNX的挽歌。
与分析机构作为旁观者轻松评论不同,这家叫做达沃时代的公司,推出了一款新的存储产品——采用ServerSAN路线,基于软件定义设备、应用定义存储的创新理念的逸存B系列(YeeStor B serials)分布式块存储服务系统,向以EMC为代表的传统存储厂商发起了挑战。
达沃时代董事长和创始人田大庆表示,面向云计算、大数据时代的存储,拼的将不仅仅是处理速度、容量和可靠性,存储与应用的结合与融合,与计算、网络的融合才是竞争的关键,而这些不是传统磁盘阵列的优势。也就是说,达沃时代认为,自家的YeeStor B serials将会颠覆传统IT系统建设模式。
 
 
达沃时代董事长和创始人田大庆
巨头落伍
云计算、大数据时代的来临,为达沃时代推出这款存储新品提供了机遇。根据IDC的预测,从2013年到2020年,IT市场90%的增长将会来自于移动、社交、云计算和大数据领域。目前,不论EMC、NetApp、HDS、Dell、IBM,还是华为、浪潮、曙光,都已经以云计算、大数据基础架构为卖点。
达沃时代认同数据是未来的核心的观点,也认同虚拟化对云计算的重要性。但田大庆还对弹性扩展有非同一般的重视,因为未来还更多的数据。田大庆表示,未来数据社会的基础生态将包括面向私有云、公有云、混合云兼存的应用服务生态,和面向大数据、移动互联、物联网的数据服务生态,而数据存储的技术与服务的创新是构建整个生态的关键点。
对于传统存储阵列而言,再怎么Scale-out也总有天花板,况且昂贵的阵列也未必适合海量的价值密度较低的非结构化数据,也就不如更加廉价的通用服务器集群,SSD和冗余的应用会弥补它相对于盘阵的性能和可靠性的短板。目前,在大数据领域占据绝对统治地位的,确实是以Hadoop集群为代表的分布式系统。而Google、Facebook、BAT等基于数据运营的大型互联网企业也没有采用传统存储,尤其是阿里巴巴高喊去IOE好几年了。国外的媒体则评论称,阵列至少还能存在25年,但它们已经过了高速成长期, EMC必须接受这个事实,然后继续前进。
分布式架构意味着存储与计算融合。融合存储不是新概念,过去传统存储厂商的重心在于协议层、介质层的融合,提供的还是阵列产品,Hadoop的应用范围也有限,直到Nutanix、EMC ScaleIO、VMware VSAN等产品的出现,计算和存储融合、用软件+通用设备部署和管理存储的趋势才更加明显,VMware也在不久前的VMworld 2014大会上推出了超融合型基础设施EVO: RAIL。
中国工程院院士倪光南表示,整个存储和整个云计算架构的融合意味着更低的成本、更多的可能,面向应用的存储,或者说应用定义存储就可以推出。他认为,达沃时代提出的应用定义存储比业界通常说的软件定义存储(SDS)更有创新性,且符合云计算的潮流,新的理念和技术架构可以覆盖更广的领域,将使得中国厂商在国产化浪潮下能够与跨国巨头在同一起跑线上展开竞争。
田大庆表示,传统存储巨头尽管对趋势有所认识,EMC、IBM都知道阵列必死,但新架构对现有阵列业务的冲击影响了他们的发力革自己的命。这是有道理的。EMC的软件定义存储产品ViPR的发展遭遇内部阻力就是明证。该项目允许客户利用其它更廉价的设备替代VMax、VNX,自然让负责VMax、VNX的同事不满。VMware的软件定义存储产品VSAN则因为子公司的独立性得以大力推广,但VMware仍要小心翼翼地避免和EMC(当然还有NetApp等存储合作伙伴)的竞争关系,强调只是为优化vSphere的性能和成本、支持软件定义数据中心的构建而生。
达沃时代认为,Server SAN是软件定义存储的代表,应用定义存储则是软件定义存储的深化。田大庆表示,达瓦时代最优信心的,就是市场会更专、更贴近应用。他举例说,达沃会针对农业某一类具体应用、数据库某一类具体应用或者互联网中的某一类具体应用,全力以赴地贴合,而EMC、华为、浪潮等公司的应用贴合都非常弱,EMC等国外厂商因为投入产出比的大幅降低而不愿意做这样的事情,然而达沃是搞应用起家的,对大量用户会产生大量的效果。
在田大庆看来,存储产品型号将不再以性能、规模、协议(SAN、NAS、SCSI、CIFS、POSIX等等)来划分,而是将类似花生地、水稻田的土壤划分。“不是我们要颠覆谁,而是现在处在颠覆的时代,我得参与到颠覆中来,成为颠覆者之一。”田大庆说。
YeeStor B serials问世
达沃时代CTO雷迎春博士详细介绍了达沃时代的核心技术和YeeStor B serials产品。达沃时代的核心,是“应用定义的存储操作系统”YeeOS。首先,YeeOS与传统SDS一样独立于硬件,但它强调对硬件的感知,这是因为高性能的x86、低功耗的ARM、大容量的HDD、高性能的SSD已经是百花齐放,用来支持不同的应用场景。其次,YeeOS是Client-Server结构,通过部署YeeOS Client和YeeOS Server到不同服务器节点,支持融合和分离两种结构。但YeeOS不是一体机,而是超融合,尤其强调存储与应用的融合。例如,针对虚拟化的融合,其虚拟计算平台专门提出VM对象,以VM为中心来分配存储资源、存储的管理,包括监控和快照,简化应用对存储的使用。这类似于Nutanix和VSAN。
针对不同的应用,达沃时代反对过度的配置。“我们的目标是用商品化硬件提供应用所需,如果系统本身有按需扩展的能力,就可以按照应用的所需去自由扩展。在软件方面,我们提供REST API,允许存储和应用的融合,应用可以自动化配置底层的存储,如QoS、数据保护、性能的一些特性。”雷迎春说。YeeOS的基础是对象存储——对存储资源的抽象,较为适合分布式处理,支持多种接口,包括:文件、块、S3对象和VM对象,整个系统由元数据集群和数据集群组成,形成类似于数据库的计算密集型的元数据服务,要考虑去重、压缩、低延迟等因素。
 
YeeStor B serials
YeeStor B serials中,每一个块和文件都有一个元数据项描述,Meta Containers包括了100万个元数据项,一个节点包括若干个Meta Containers,而Meta Containers和节点本身是没有固定的关系,所以任何一个Meta Container都可以在服务器中间漂移,可以很好地实现一些集群服务,如自由迁移、动态调度。每个节点还可以看到完整的名字空间,与位置无关,所以动态迁移很方便。
基于YeeOS打造的YeeStor B serials系统,支持PCIe-SSD、SSDs、HDDs等介质混插,横向扩展集群节点支持达1024个,系统容量支持60TB至64PB超强伸缩,提供20万至100万IOPS。首次实现了创新的ROWS(优化读、顺序写)框架,通过配置对读、写施加不同优化策略满足应用需求;全新的元数据处理及数据持久化结构,使系统既支持混合存储结构,也支持全闪存结构,基于SARD (基于服务器的适配性冗余分布)框架,每一个卷的逻辑块被分布到每个服务器的每个驱动器(磁盘或SSD)中, I/O处理均匀分布,消除系统瓶颈,没有单点故障,系统可用度达99.999%。
ROWS的读写分离是一项不错的创新。对于传统的集群而言,我们更关注规模而不是单节点的性能,这与对数据库乃至大数据分析负载的需求相左,达沃时代的ROWS技术,用非易失内存把应用发出的随机IO转成顺序写,充分发挥磁盘顺序写和闪存随序读的优点,解决了这个问题。
针对不同行业用户的共性需求,YeeStor B serials集高性能、高可用、高可扩展、简单管理等优点于一身,并且具有超高的性价比。在性能上,其访问前端采用高性能SSD盘作为读写缓存,效率成数十倍的提升;同时,存储系统支持InfiniBand、10Gb/s以太网等高速网络全连接,存储和读取效果更高。系统对磁盘故障的处理无需中断上层应用,而且重建速度大大超过传统RAID,减少数据重建过程中二次故障导致数据破坏的可能性。同时系统提供毫秒级步增式快照备份服务,并通过快照技术融合主存和备份,即在存储系统本地同时保存主存数据和快照副本,无需用户额外购买备份软件和相关硬件,降低成本和管理的复杂性。
对于巨头目前力推的全闪存阵列(AFA)产品形态,雷迎春认为,AFA仍是传统阵列的延续,而数据中心强调的时横向扩展的系统。以Gartner的预估来看,AFA在未来5-10年可能萎缩到20%左右,而IT系统正在转向云,达沃时代也不认为闪存会完全取代磁盘,因此,达沃时代注重横向扩展、闪存和企业级特性,如现在互联网企业搭建的架构中没有的快照、备份等功能。
颠覆,生态为王
对于VMware的成功,VMware大中华区总裁宋家瑜表示,这不是VMware自己的成功,而是一个生态系统的成功。其实,在IT市场,能获得市场认可的解决方案必须是基于一个生态系统的,在云计算和大数据时代尤其如此。所以,虽然国产化的政策让“去IOE”一时成为热门话题,虽然自认为已经和EMC打过仗,但田大庆不认为横空出世的达沃存储就能直接和EMC PK,哪怕自家的应用定义存储架构比传统的存储阵列或者SDS更加先进,这是因为EMC具有强大的生态链,而初创的细分厂商的生态链还没建立。换句话说,不管是否想要颠覆EMC,达沃时代都要打造自己的生态系统,才有可能赢得市场。
 
达沃时代全力构建生态系统
在生态链方面,达沃的策略仍然充满应用定义存储的鲜明印记。“在打造生态链上,第一我要主动整合,第二个我真的是面向用户的更创新的应用去整合。”田大庆说,达沃时代生态链不能在传统的市场上合作,服务器、数据库、存储和应用软件公司各自干各自的,各自到用户去那吹自己的产品如何好,而是要找到志同道合的伙伴,主动围绕用户的需求来整合自己的解决方案,真正帮助用户解决问题。他认为,存储创新是构建整个生态的关键点,然而要面向应用,与应用层厂商的合作显得很重要。
达沃时代的生态主要涵盖六个层面:面向行业创新应用的生态,面向自主创新的生态,面向传统IDC改造升级的生态,面向硬件制造商、集成商的生态应用方案整合,面向小、微创新技术企业的生态
技术合作、整合与市场共享,以及科研机构、大学的技术资源整合生态。田大庆称,达沃时代正改变传统存储服务商帮用户建设信息系统的产品供货模式为:与行业用户合作建设的系统服务模式,也就是私有云+公有云的混合服务模式。
提升行业、组织的应用水平将是达沃时代生态链的重要发力点,这包括数据整合水平及数据服务能力,混合云服务的开展程度。田大庆表示,达沃时代将以教育行业为龙头开始相关工作,包括资源整合、混合云平台建设等等,这是目前他们在国内最有竞争力的行业。
目前,360、云杉网络、鹏博士等数十家企业已经和达沃时代签署了战略合作协议。田大庆相信,凭借先进的技术理念和产业生态的力量,达沃时代将可在云计算和大数据时代的IT市场撕开EMC等传统厂商的缺口,打下一片新天地。