颠覆创新让闪存卡展现百米冲刺的马拉松性能

2015年1月29日,Greenliant在中国推出高可靠的NVMe闪存存储产品G-card。最大亮点是业界第一款板载硬件RAID的闪存卡。那么Greenliant是一家怎么样的公司?公司创始人为什么会进入这个领域?其推出的G-card闪存卡与Fusion-IO 、INTEL、LSI、美光、SanDisk等已经面世的PCIe闪存卡有什么不同?其产品优势在哪里?是否是颠覆性产品?那么就由数据中心的应用需求来带领大家走进Greenliant这就公司。
硬件加速成为数据中心进化重要特征之一
人类社会的进步表现在对未来的不断追求,对于数据中心,同样是一直追求更安全、更快、更便捷的IT系统。我们知道早期的数据中心架构系统,服务器选最好的服务器、网络选最好的网络、存储选最好的存储。但是随着数据的增多、应用的复杂,最好的搭配并不能加速数据中心所有的应用。
特别是今天,随着互联网云计算的发展,软件定义数据中心成为现实,出现了定制化、标准化的服务器节点为基本单元的系统。解决了定制化系统中的系统如何架构,解决了把资源动态调整到其他的业务应用。软件定义数据中心特点是什么呢?一个是硬件加速,不同的场景要保证最佳性能。第二软件定义,第三标准化驱动。这样才能够得到统一管理。我们也知道现在数据中心,所有的瓶颈不是在CPU,不是在内存,不是在通路,而是在磁盘。今天我们介绍的Greenliant的主要业务就是解决硬件加速这一重要特征。
 
 
Greenliant 公司创始人叶炳辉先生
Greenliant是圆梦闪存的新起点
Greenliant是一个新公司,但是属于很资深的新公司。公司创始人叶炳辉,在1978年就在Intel担任研发工程师了。1989年,叶炳辉成为了Silicon Storage Technology共同创办人和CEO,就是SST公司(硅存储科技公司)。SST是一家生产闪存记忆体以及相关产品的公司,也就是这个时候,叶炳辉就开始专注在闪存相关的研发。于1991年推出业界第一款ATA闪存控制器和2.5英吋固态硬盘,并开发了嵌入式闪存记忆体芯片技术SuperFlash,带来了闪存嵌入式应用的爆炸式增长,当前SuperFlash已经应用于全球超过300亿器件中,授权给超过11家芯片厂商,其中包括IBM、Taxes Instrument(德州仪器)、Motorola(摩托罗拉)、NEC、Toshiba(东芝)、Samsung(三星)、TSMC(台积电)等等。
叶炳辉谈到早在2005年苹果推出iPod nano时就是采用了SST嵌入式闪存及固态存储控制器,到了2006年,SST开发一个全球最早的微型固态硬盘,叫做NANDrive。一直到2010年卖掉SST。叶炳辉一直有一个梦想就是要做固态存储,要做可以大规模数据存储应用的闪存卡。也就是这样的信念,让叶炳辉能20多年一直在闪存领域不断突破。
2010年之后,云计算、互联网公司的崛起让数据中心进入了全新的时。叶炳辉认为时机已经到来,他说“我要继续圆我的梦,当二十多年前成立SST时将公司取得名为Silicon Storage(硅存储)就是想做固态存储。但因为整个市场不成熟,就先致力于嵌入式闪存记忆体芯片的研发。到了2010年左右,我觉得这个时机已经差不多了,带领SST的研发和市场部门的核心技术员工以及管理层成立Greenliant以后我们就做固态硬盘。同时要维持我们的宗旨,做产品要高可靠,高安全性。”
 
2013年,Greenliant推出支持断电保护的工业级固态硬盘ArmourDrive,2014年推出面向新一代数据中心,可用于企业以及互联网应用的高可靠性和高性能的NVMe闪存存储卡。
Greenliant由Green和Reliant两个含义组成,代表绿色与信赖。也是公司未来发展的信念所在。
Greenliant公司具备在闪存市场成功的三大优势
叶炳辉讲到PCIe闪存卡因为应用时间长、技术成熟、性能优越,成为企业主存储系统的首选。同时Greenliant有三大优势能让其在硬件加速市场的斩获成功。
 
现在一个NANDrive颗粒容量可以做到128GB 
 
第一就是Greenliant技术团队对闪存的设计及其物理层面有很深入的了解,知道怎么控制它。前面我们谈到Greenliant的技术团队主要来自SST,SST开发一个全球最早NANDrive。因此在NAND Flash上,Greenliant技术团队有着先天的优势。
第二,Greenliant有很好的控制器的经验,有二十几年设计的经验。包括叶炳辉本人一直致力于闪存控制器的发展。其团队技术以及经验都无比丰富。
第三,Greenliant有闪存产品的量产经验,因为闪存产品对质量的要求非常高。2010年推出新一代高可用闪存控制器和NANDrive微型硬盘,到目前为止,NANDrive微型硬盘出货量已达1000万颗。事实上,Greenliant对于闪存产品有着长期技术积累,同时拥有相关产品的量产和质量管控的实力,在过去每天出货超过两百万颗闪存芯片的时候,仍然保持产品的高品质标准。
让笔者印象深刻的是叶炳辉谈到特斯拉创始人马斯克创立的美国太空探索科技公司SpaceX也是其用户。我们也看到叶炳辉20多年的工作与闪存紧密结合。可以说是看着闪存应用一步步走到今天这种热度,同时因为他精通技术,所以他所看到的技术革新总会从芯片工艺、架构设计等多个方面切入,这也为我们下面讲到Greenliant最新的高可靠NVMe闪存卡G-card,与绝对多数的闪存卡有多么大的不同。
Greenliant最新的NVMe闪存卡G-card的不同之处
当前闪存的热度,不仅国外许多公司在做,国内我们也看到许多新成立的初创公司在做。“一张卡不代表什么,现在中国大陆这边也有初创厂商在做。但是,要拥有自己的控制器技术和芯片制造就不是那么容易的了,全球能够做到这点的厂商大家可以屈指数一数。”叶炳辉谈到。
官方给出的Greenliant G-card的主要特性:
高可靠性: ECC + 自带 RAID + 掉电数据保护 
高扩展性 
并发读写 
持续低延迟 
支持 UEFI BIOS启动 
分布式ECC设计让性能持续成为可能
当Flash设备随着使用时间和数据量的增长,坏块会逐渐增加,会产生大量的ECC Error,这时设备性能和可靠性会大幅度下降,对应用性能和数据安全带来影响。这就造成常见闪存卡ECC模块设计潜在的问题:性能衰减和可靠性下降。
由于NAND Flash的工艺不能保证NAND的Memory Array在其生命周期中保持性能的可靠,因此在NAND的生产中及使用过程中会产生坏块。为了检测数据的可靠性,在应用NAND Flash的系统中一般都会采用一定的坏区管理策略,而管理坏区的前提是能比较可靠的进行坏区检测。 
G-Card分布式的ECC校验架构,就有点像动车了。在每一个颗粒里面,都封装了一个小的控制器,这个控制器就支持我们内部的ECC校验的处理。这就意味着即使说出现比较多的错误,我有更多的处理的校验的芯片在里面,因此我的性能不会受影响,我的可靠性也不会受影响。这样就说在颗粒内部实现非常好的性能和可靠性的保障。
 
Greenliant  G-Card 分布式ECC设计架构—NANDrive模组
Greenliant磨损平衡的测试数据显示,每一个块的擦写次数的偏差都在7%以内,非常小的偏差。这样就保证非常高的可靠性,为此,一天全卡擦写10次,G-card可以至少使用5年。Greenliant VP李炫辉讲到“这五年之内,G-card基本性能和可靠性,没有变化,一直在整个生命周期是可持续的。这就是闪存里面的磨损均衡,我要保证颗粒大家都用的次数差不多,我要有一个磨损均衡的算法。”
软件定义存储厂商达沃时代CEO 张松讲到,“大家谈到SSD盘最大的问题就是它的写老化,用一段时间性能会急剧下降。这个下降就因为它是电子颗粒读的次数多了,你没有相应的措施,它肯定会老化的。只要是ECC多了,会使得整个表现的比较平稳,可以抵抗未来的你多少万字读写之后写老化的急剧下降,使得整体的性能比较平稳。当你做的校验多了,你肯定对性能有影响。所以它是有比较平稳,不是拼峰值,拼的不是百米,拼的是马拉松。
 
 
由左至右:达沃时代CEO 张松、Greenliant Founder&CEO Bing Yeh、Greenliant VP李炫辉、维金技术副总裁梁金阁。 
 
这也是应用在一些企业级环境里面所关注的特性,因为我们谁都不希望说,我买来一个产品之后,过了一年、两年,它的性能只有过去的五分之一,或者说一半,或者说它的可靠性降低。
业界第一款板载硬件RAID的闪存卡
我们知道PCIe设备是不支持RAID卡的,这时候如果出现颗粒级的故障,数据就会丢失。Greenlian在板卡上又定义了一个硬件RAID。每五个NANDrive颗粒做一个RAID组,连接一个阵列控制器,我们上面一共有8个阵列控制器,控制了8个组。这样保证说当颗粒出现故障的时候,用户的数据也是安全的。
 
 
图上可以看出单卡板载20颗 NANDrive 每5颗 NANDrive   组成一个RAID 组 
共计4个 RAID 组。但是目前可以实现单卡板载40颗 NANDrive 
每5颗 NANDrive   组成一个RAID 组 
共计8个 RAID组 
“Greenlian板卡就在这种NANDrive微型硬盘颗粒之间再实现硬件的RAID,这样就解决了用户对于数据高可靠性的一个要求。因为大部分PCIe闪存卡,都是基于操作系统的一个RAID,就会造成性能下降,加大颗粒的磨损度。” 李炫辉讲到。而Greenlian的G-card闪存卡直接实现颗粒之间硬件RAID,
最新G7100系列G-card,包括了G7101、G7102两个型号,G7101原始容量为1.37TB,G7102原始容量为2.75TB。但是因为RAID需要,其实际数据存储容量分别为900GB和1.8TB。
超级严格的掉电数据保护
Greenlian还有一个业界最苛刻的掉电数据保护的测试,针对不同的使用场景,在正常的读写过程中,随机掉电或者多次进行掉电测试。
上海维金是一家互联网金融公司,其技术副总裁梁金阁表示对于互联网金融相对来说对存储的要求会很高。你让用户的钱莫名其妙的丢了少了,这也是不可接受的。。
“我们也希望数据的存储,至少是可靠的。我存下来的数据,我可以存不下来,但是我告诉用户这个数据是存下来的,那就必须得存下来。不能够说现在存下来,但是各种原因没了,这个是不行的。这样我们当时跟Greenlian合作的时候,我们也一再强调你们一定要给我们证明你们的掉电保护是靠谱的,后来他们就做了很复杂的掉电保护的测试,当时拿这个报告给我们看,把这个操作步骤告诉我们。我们自己也在测试环境下去模拟这个环境,最后验证了这个数据确实没有丢,和他们的报告是完全一致的。”
   
高扩展性 让Server SAN实现全闪成为可能
PCIe闪存卡应用于服务器搭建,排除价格因素,市场上绝大多数PCIe 闪存卡方案都需要持续占用主机CPU和内存非常多的资源,不能进行多卡配置,否则无法保证应用所需的性能。这也是闪存卡只能作为核心数据的存储,而不能作为所有数据的存储器。
 
在8核, 16线程 Intel(R) Xeon(R) CPU E5-2450  @ 2.10GHz 平台测试
从图片可以看出,同样的IOPS,G-card占用CPU远远小于友商的同类产品。因为占用CPU资源的差异来自于驱动程序和卡系统架构的设计
因为G-card 占用很少的系统资源,所以可以在服务器端搭建多张闪存卡,组成大容量的主存储系统。那么用户实现PCIe闪存卡用作主存储成为可能。
在服务器中采用多张PCIe闪存卡,实现本地大容量高性能存储,或搭建软件定义存储架构(Server SAN),G-card 在性能和容量方面展示了优异的可扩展性。在IOPS,延迟,功耗,尺寸,初始成本和总体拥有成本方面 显著优于其他的主存储方案。 
Greenliant G-card 与 全闪存阵列对比
通过上面的介绍,我们知道了相对于其他的PCIe卡,G-card通过卡系统架构的设计占用很少的系统资源。绝大多数PCIe卡厂商因为占用CPU等计算资源太多,而只能为服务器提供2-4张闪存卡供主存储。
而G-card可以为服务器单机搭建十张以上的G-card卡片而不影响系统资源。因为通过G-card卡的出现为行业闪存应用提供了新的方向。那么相对于目前流行的全闪存阵列其性能与G-card卡搭建的存储性能,谁的优势更明显?让我们具体看数据。
 
服务器单机搭建多张Greenliant G-card卡片的性能测试结果以及与行业领先全闪存阵列系统对比 (见下表)
 
 
硬件加速做到极致也是一种美
综合其可持续低延迟,高IOPS,强大的可靠性,和出色的可扩展性,使G-Card非常适合I/O密集型的关键业务应用,如数据库、内存计算、大数据分析、虚拟桌面应用(VDI)和联机事务处理(OLTP)。
另外,使用附带的软件工具,G-Card可以平衡性能与容量,做到灵活配置。同时采用MLC  NAND闪存,G-Card完全可以为现代企业和互联网数据中心提供成本效益突出的一线主存储解决方案。
上海维金技术副总裁梁金阁认为互联网金融行业对数据安全这一块,我们要求还是不低于金融行业。这方面因为G-card确实比较靠谱,通过闪存卡的不断优化,让我们也可以在软件上面省去很多为了数据丢失而所做的重复工作,这是上海维金与GREENLIANT合作的最大优势之一。
达沃时代CEO 张松认为未来全闪阵列是一个方向的,但是也是计算和存储融合的东西。服务器里不会有硬盘了,全是G-card闪存卡或者SSD,这是作为软件定义存储厂商的一些思考。
最后负责亚太地区营销业务的李炫辉深有感触,他虽然到任Greenliant公司亚太营销副总裁时间还不到一年,但是在与本地化合作伙伴的交流中,明确了Greenliant在伙伴策略上的定位。Greenliant将一如既往地为所有伙伴提供技术和服务支持。