DoSTOR专家观点:本文作者Greg Schulz是StorageIO集团的创始人和高级分析师,以及《弹性的存储网络》(Elsevier)一书的作者。
就像俗语说的,最好的I/O(输入/输出)就是你不需要为I/O做什么,但是现实是即使拥有I/O虚拟化和虚拟I/O技术,还是需要一定方式才能使I/O更有效地存储和访问数据。
之所以需要更有效的I/O性能还是因为长期以来而且还将持续的服务器与存储之间的I/O性能落差。硬盘驱动器(HDD)的存储性能发展速度没有赶上服务器处理能力的可靠性及能力的增长速度和服务器成本的下降速度。你可以在这里看到更多的关于数据中心瓶颈和服务器/存储性能的I/O落差的信息。
随着人们越来越开始关注能源、冷却、占用空间以及与它们相联系的生态经济(生态的和经济的)问题(这些问题正在影响着IT数据中心和存储),固态硬盘(SSD)已经重新崛起成为应对这些问题的一个解决方案。SSD并不是一个新的技术,它已经存在几十年了,但是直到最近两年,人们才对SSD开始有了新的认识和兴趣。厂商们开发出新形式的SSD类别的技术,将这些技术做成打包的可选项,并按市场价格出售(消费者、中小型企业、中端市场、企业)。甚至EMC这样的公司也采取行动,在上周郑重宣布SSD计划(见EMC进入固态市场)。
大约20年前,一家当时名叫DEC的公司是开放系统SSD的早期采用者和推动者。我记得当时仅有200MB(对,是MB)的SSD(两台镜像设备以备复原)的价格非常高。以今天的标准看来,当时的价格确实很离谱;但是,和在他们之前出现的大型机SSD解决方案比起来,他们还是有竞争力的。
一般来说,SSD是基于动态随机存取存储器,也就是DRAM,或者说是安装在你的计算机上且一般被叫做RAM或内存的东西。许多存储系统也将DRAM作为高速缓存或易失性记忆体以提高HDD的性能。使用RAM的好处是它的读取操作(IOPS)要比HDD的读取操作明显快很多,这是因为RAM记忆体内没有移动部分,而即使最快的HDD也需要移动部分,而这些部分会延迟寻找和传输速度。
一些SSD厂商可能会宣称他们的产品没有延迟问题。但是,如果你仔细观察,你会发现延迟并不是不存在而只是不那么明显。一个典型的存储I/O读取模式就包含了I/O命令初始化,寻找和定位,然后是数据传输时间。假如你有更快的介质和接口可以改善数据传输时间,并排除寻找时间,那么你就可以提高性能。在SSD情况下,寻找时间实际上被排除了,而介质传输时间如果不是被排除那也是被减少了,剩下的大部分I/O时间是在特定接口上根据命令或协议表头进行传输,以及在应用程序服务器上的I/O预处理和后处理。
成本问题
这听起来很好,但是为什么我们不安装更多的SSD呢?简单的说,答案就是成本。一个很矛盾的现象就是,当你按每GB或每TB成本比较SSD和HDD时,HDD更便宜,而SSD成本更高;但是,如果你比较I/O处理能力,以及要达到和SSD同样水准的IOPS、带宽、处理负荷或有效负荷,需要多少HDD、接口、控制器和机箱时,那么SSD就显得更经济。同HDD相比,按照容量计算,除了高成本以外,DRAM的另一个不利方面就是其保存数据所需的电力较多。
DRAM在读取上的性能表现非常好,但是奇怪的是SSD只能用于小量的随机的IOPS,这种情况从早期一直持续到现在的一些产品。有一些DRAMSSD解决方案可以同时支持光纤通道和InfiniBand,并能够同时处理小量随机IOPS和大量的序列传输工作负荷。
多年来,DRAMSSD解决数据持续性问题的方法是通过电池来支持高速缓存或当主电能无法用时,通过UPS设备来维持记忆体的电能。SSD也将电池备份和内部的HDD整合在一起,这里的HDD可能是独立磁盘、镜像磁盘或校验保护磁盘,但都通过电池来供能,这使得当出现电源故障或电源切断的时候,DRAM可以冲洗(下线)到HDD。虽然基于DRAM的SSD的性能要明显优于基于HDD的系统,但是SSD仍然需要电力来支持其内部HDD,DRAM,电池(蓄电池)和控制器。如果你担心绿色和环保问题,那么你就会考虑这些电池以及它们的安全处置措施(如,WEEE–废弃电子电气设备指令,和RoHS–电子电气设备所含有害物质限制)。
替代方式:闪存
DRAM在电源切断的时候就不再保存数据。和DRAM不同,基于闪存的记忆体已经受到了越来越多的欢迎,这是因为其单位容量成本比较低而且其存储不易丢失,也就是说在保存数据期间不需要电源。鉴于其低能耗,低成本和良好的容量,以及电源关闭时保持数据的能力,闪存记忆体已经在低端的USBU盘和如iPod这样的MP3播放器中得到了广泛应用。
基于闪存的记忆体的不利方面是它的性能,特别是在写入方面不如基于DRAM的记忆体;而且,过去,在记忆体单元重写和更新的次数上,闪存的负载周期有限。随着目前企业级闪存的出现,它们的负载周期要比普通消费者所用的或一次性闪存产品的负载周期要高得多。
将这两种方式结合起来(混合方式),最好就是将RAM作为共享存储系统的高速缓存,利用缓存算法来最大化缓存效果,优化预读、后写以及校验操作来提升性能;同时用闪存来保存数据,充分利用其相对于所有基于HDD的存储系统都更低的能耗和改善的性能。
因此,在企业级的基于闪存的存储系统上,你可能需要支付更高的价格,因为它将使用一定的DRAM来作为高速缓存缓冲区,以便加速对闪存的读取和写入,同时,除了一般的内存奇偶校验码外,这个系统还要采用一定形式的数据完整性保护。即使是企业级配置,这种系统总体上还是低成本。在享受将更多的数据存储在SSD上的优势的同时,还可以得到更低的能耗和更高的性能。从单位事务处理或单位工作负荷的角度上看,其价格也更加合理。
例如,TexasMemorySystems(TMS)公司在2007年推出的RAM-SAN500就由一个RAM来作为高速缓存和基于闪存的存储来进行数据保存。EMC也刚刚宣布在他们的以DRAM作为高速缓存中心的DMX系列存储系统上安装了基于闪存的SSD。对于EMC来说,基于SSD和DRAM的技术并不陌生,他们早在上世纪80年代末期就利用了这些技术,而且成功推出了以高速缓存为中心的大型存储系统,即DMX系列。
这些消息和其他的消息一起标志着SSD重新回到了行业舞台的中心。在台式机和消费者的层面上,SSD也频频露相,比如三星推出能够替代或辅助笔记本HDD的SSD,或是FusionIO卡,这种卡能够安装在计算机I/O槽,并通过直接插入或通过内部PCI总线来闪存读取存储。这些都是由传统的DRAMSSD组件和存储解决方案厂商所推出的,而且他们继续在性能、价格和产品组合上改进他们的解决方案。
能源
随着像电力、冷却和占用空间这样的"绿色"存储和数据中心问题日益重要(见"如何保持性能、可靠性、容量和能源的平衡,并满足存储能耗和冷却需求"),我们正在从如何避免使用电力的讨论转移到如何利用好手中已有的电能以达到更好的能源效率,包括提升性能的同时降低能源消耗,以及智能电源管理–通过智能电源管理,可以在不牺牲应用程序性能或可靠性的前提下降低电力消耗。
上世纪70年代的石油危机时的市场风向和现在关注绿色IT和存储有一些有趣的相似之处。在70年代的石油危机中,人们发起了节省能源和避免能源消耗的运动,我们能看到类似的关于避免存储中能源消耗的信息,第一代MAID的出现占据了许多头版头条。其后的能源节约浪潮主要是引入更加具有能耗经济性的汽车。在存储领域中,类似的故事包括智能电源管理、以及按照单位能耗计算能够比过去承担更多工作负荷或活动、能够处理更多事务、能够访问更多文件、具有更高的IOPS或带宽的存储。下一个浪潮将包括采用更好的实践,包括更好的数据和存储管理、归档、压缩、重复数据删除,以及采用一定形式来降低数据占用印迹,使用其他技术工具来在现有资源的条件下做更多的事情和维持业务发展。
曾经有说法认为SSD只适用于数据库而不适用于文件。事实是,在过去,由于基于DRAM的解决方案的成本比较高,所以只有特定的数据库表或文件,索引,日志或日志文件,或其他暂时的性能密集型数据会放在SSD上。如果数据库足够小或你的预算足够多,那么整个数据库都可能放在SSD上。现在,由于DRAM和闪存的成本比较低,许多新的应用程序和用途设计都使用了SSD技术。例如,使用高速缓存I/O加速器(例如来自Gear6公司的产品)可以提升NFS(网络文件系统)的文件服务器的数据访问性能。这反映了一种行业趋势,以及闪存SSD所带来的商业利益。
在非网络附加存储的情况下,一般来说,通过SSD来手工解决I/O性能问题的方法是使用"热文件"I/O分析工具来跟踪性能瓶颈或那些I/O活动过多的文件,并将这些文件列为需要移动到基于块存储的SSD的候补文件。由于在过去几年人们主要关注如何提升存储利用率,在一些情况下忽视了性能,因此在未来我们将看到存储和IT资源管理工具将会把更多的注意力放在性能上,以帮助使用更高性能的存储层。换句话说,从节约能源转移到提高能源效率。
有很多厂商曾经进入过SSD领域,其中有Imperial,MTI,通过DEC的昆腾,以及StorageTek等。现在涉足DRAM和基于闪存的固态硬盘、组件或解决方案的厂商包括Bitmicro,Curtis,戴尔,EMC,Gear6,Imation,Mtron,STEC,三星,SanDisk,希捷,SolidData,Ridata,TMS和东芝等。
对于那些认为HDD现在没有前途的人来说,实际上,就像磁盘出现后,磁带起了辅助作用一样,SSD(DRAM和闪存)实际上将帮助减少加诸于HDD上的性能压力,从而让HDD能够以更为有效和经济的方式进行使用,就像现在磁盘和磁带的关系一样。我认为我们将看到一些厂商开始使用标准的标杆–包括统计过程控制(SPC)、标准性能评估机构(SPEC)、事务处理性能委员会(TPC)和MicrosoftExchange解决方案评估计划(ESRP)等–来作为功能的"指示器",以此来支持他们关于性能和能源的声明。
但是,要记住,作为功能指标,在对待这些标杆时,我们都应持保留态度,而真正的比较应该是看这些解决方案如何能够稳定地扩展以满足我们的特定需求。我并不准备惊讶,但是我们可能将看到EMC加入到绿色标杆制订的争论中。
总结一下,2007年是行业开始准备SSD和基于闪存技术的复苏的一年。2008年将是关注和早期采用的一年,包括厂商采用和客户的早期部署。2009年将是更大范围地采用更具能效比的存储技术的一年,这些技术可以用更少的能源做更多的事情,而且还不牺牲性能。