EMC正积极推进机架级存储项目的发展

EMC公司当下正积极推进两大工程技术项目的发展,它们分别是基于闪存的DSSD以及虚拟SAN ScaleIO。两大项目都将目标指向了机架级别存储业务领域。

DSSD源自EMC公司于去年五月完成的一笔收购,该项目意在打造一整套设计方案、利用PCIe接入闪存作为持久存储层。

其设计思路在于将机架内塞满闪存存储设备,从而满足内存内数据库以及实时分析工作负载对于低延迟访问的实际需要。

那么闪存设备的容纳量到底如何?一台33U XtremIO 6-X-Brick集群拥有120TB原始闪存容量。如何按照同样的每U存储TB数字来计算,那么42U机架应该能够为我们带来151TB空间。相比之下,HGST的第二代Skyera产品Skyhawk能够在1U空间内提供136TB闪存容量,这使得XtremIO即使经过扩展、其闪存空间容纳能力仍显得十分可怜。一台42U Skyhawk机架将提供5712TB容量——这绝对是一份值得大书特书的出色成绩单。

诚然,DSSD目前正在寻求将机架存储容量提升至PB级别以上的办法。在Stifel Tech大会的一次发言当中,EMC公司新兴技术部门总裁Chirantan “CJ” Desai表示DSSD产品将于今年晚些时候正式推出,且同时提供数据块访问与HDFS支持能力。他同时指出,该产品将不会采用现成的PCIe闪存卡、而是选择PCIe作为原始NAND闪存的接入通道。

这意味着该产品实际上也不会使用DSSD。相反,类似于Violin Memory与HGST的Skyhawk,EMC的方案将直接采用NAND晶片并对写入操作削减、垃圾收集以及其它一些功能加以管理。

其DSSD产品在存储资源密度方面将高于XtremIO阵列。但该方案将不具备XtremIO的各类数据服务,例如精简配置、重复数据删除、压缩以及快照等等。

EMC II公司总裁兼倡导者Chad Sakac在博文中写道:

“我们在Thunder项目当中还总结出了第三项重要经验。在大多数情况下,理想的接口并不是IB/以太网(内存映射)之上的RDMA。

相比之下,开发人员更倾向于通过应用程序API与持久性存储层进行直接交互。大家可以通过NVMe完成这一目标,而且该机制很可能与HDFS、键值存储以及其它技术实现‘严丝合缝’的匹配效果。而这正是DSSD的意义所在。”

DSSD技术是真正的“架顶式、池化服务器-内存-闪存”,并能够提供高达百万级别的IOPS表现。

DSSD技术当中涉及多块闪存驱动器,每一块都拥有自己的控制器,并利用内存(即RAM)为闪存提供缓冲或者缓存区。主机(即应用程序运行服务器)通过“一套超低延迟互连机制”接入DSSD闪存存储系统。

在我们看来,这意味着DSSD产品所采用的互连机制与InfiniBand或者100GbitE有所不同。这不禁让我们想到英特尔Silicon Photonic中的Omni-Path架构。

我们似乎可以期待着该产品的数据访问速度要比网络XtremIO阵列更为出色。

DSSD软件将对闪存资源进行管理及池化,并自动完成方方面面操作任务。Sakac表示,数据块与文件访问堆栈都将在此基础上进行分层。Desai的评论意见也证实,块访问已经被加入该套方案,而这将拓展该技术所适合的用例类型。我们不妨设想当下任何需要在SAN当中并行访问大量数据并需要更高访问速度的企业级应用程序——这些正是DSSD的潜在适合用例。

DSSD包揽一切

Sakac表示:“DSSD并不需要在闪存读取与写入模式之间借助任何文件/块语义。它能够通过libHDFS或者对象语义完成上述任务,或者直接映射至键值存储(利用PCIe/NVMe连接)。如果大家需要基于RDMA以及直接PCIe NVME之上的内存映射机制,DSSD产品也完全能够胜任。”

这一切建立在由Fusion-io公司提出并倡导的、将闪存作为内存的解决思路,这一点在其PCIeioMemory闪存当中也有很好的体现。Fusion-io公司联合创始人David Flynn指出,如果无需经历传统操作系统IO堆栈提供的接入路由机制,应用程序完全能够获得更出色的数据访问速度——其增幅甚至跨越数量级。

根据Sakac的说法,DSSD属于“‘超热门’前沿方案——这套基础设施能够支持以SAP HANA与Gemfire为代表的内存内数据库,外加以memcached为代表的键值存储机制。DSSD改变了内存内数据库的整个生态系统,大家能够以远低于传统方案的成本水平构建起更为庞大的内存处理体系。DSSD改变了IOPS极限并为高度依赖于低延迟水平的分布式NoSQL/SQL数据库带来理想的延迟表现——这足以使其瞬间跻身实时分析领域之中。”

我们的关注重点包括HDFS访问、块访问、对象访问以及内存内使用场景。

说到这里,我们的脑海中不禁出现一个疑问:单一服务器能否接入DSSD闪存阵列?作为一套拥有PB以上级别存储容量与微秒级延迟水平的存储系统,我们通常会将其交付给大量服务器设备共同使用——如果其互连机制允许多服务器访问的话。

也许从乐观的角度出发,我们应该认定DSSD属于一套以准主内存扩展为目标的SAN改造性方案,同时配备更快的网络接入机制、内存式访问堆栈以及HDFS。如果这一切能够成为现实,那么我们迎来的将是一套堪称磁盘SAN杀手的技术方案。

EMC公司预计DSSD产品在营收方面将迎来超过XtremIO的增长速度。后者作为闪存阵列已经在本月成功实现了年均12亿美元的营收目标。该系列的第一款产品推出于2013年5月,也就是二十一个月之前。如果DSSD能够实现EMC的既定期望,那么我们预计将在其首款产品推出后的十八个月见证其年均营收突破10亿美元。这真能成为现实吗?看起来可能性不太高。

如果以上预期成为现实,那么激进派投资方埃利奥特资本管理公司将有理由暂停其将VMware拆分出EMC并加以出售的恐怖计划,转而静待DSSD是否能够如EMC计划中那般成为推动股价上升的极效强心剂。

我们权当EMC能够在这一问题上获得肯定答案,即能够凭借着DSSD作为真正的SAN杀手级技术在IO密集型以及计算密集型PB级存储用例当中大放异彩,那么这套方案对于其它供应商又将意味着什么?

所有内存内应用程序处理系统——也就是SAP HANA——都将被吸引到DSSD当中。EMC将成为甲骨文工程技术系统之外的惟一后备解决方案。

戴尔、HDS、惠普、IBM以及NetApp则面临着被彻底挤出内存内应用程序存储市场的命运,他们恐怕需要通过收购或者自行开发来获得属于自己的同类技术方案。但该从哪家厂商手中购买?也许SanDisk收购Fusion-io的举措值得他们加以借鉴?我们不妨给Sanjay Mehrotra(SanDisk公司CEO)打个电话。

那么Violin能否收购PCIe接入路由技术并打造出能够作为DRAM扩展的自有阵列方案?答案恐怕要由Kevin DaNuccio给出。HGST的Skyera拥有必要的硬件密度,但其配套软件是否够给力?也许可以通过合作谋得生存的机会。不过总结来看,以上猜想都有些疯狂而不切实际。

可以肯定的是,EMC推出的DSSD产品势必在市场上掀起巨大波澜。也许DSSD的滚滚洪流将会吞没一切。抵抗是徒劳的,放弃挣扎倒是能帮厂商们保存一点体力。