DoSTOR存储专访 EMC亚太区CTO畅谈固态硬盘

DoSTOR存储专访:在分析机构IDC对2008年存储市场的预测中,我们第一次见到了固态硬盘的身影,IDC的分析师们认为,在2008年,不断降价的固态硬盘将逐步成为市场主流,而似乎是为了印证IDC的预测,从2007年兴起的固态硬盘热,到了2008年,其发展情况愈演愈烈,越来越多的台式机、笔记本厂商都相继采用了固态硬盘技术,而更为令人出乎预料的,是EMC在今年1月15日向业界宣布,将在高端的Symmetrix DMX-4存储系统中添加容量为73GB和146GB的两种固态硬盘,由此,EMC公司也成为了业界第一家在面向企业级的高端存储系统中,集成固态硬盘到核心产品组合的企业级存储厂商。(见:http://www.dostor.com/n/w/2008-01-15/0001338053.shtml

与我们所用的传统硬盘(采用机械装置的温彻斯特硬盘)不同,固态硬盘由于采用FLASH存储介质,它内部没有机械结构,因此没有数据查找时间、延迟时间和寻道时间,与此同时,其能耗也比传统的硬盘要低得多–据EMC方面表示,采用了闪存驱动器的DMX-4系统,其每存储1TB的数据将只比传统机械磁盘驱动器少消耗60%的能耗。但是,对于固态硬盘的寿命、价格以及在企业存储中所处的位置,业界仍然存储在争议,像业界专家Stephen Foskett就认为,仅从寿命、价格上,固态硬盘走进企业存储就暂不可行(见:DoSTOR专家博客 固态硬盘走进企业存储暂不可行

 EMC公司亚太及日本地区的首席技术官Par Botes先生

由于很偶然的机会,我们见到了来北京为EMC中国研发中心北京的员工做技术讲座的Par Botes先生,作为EMC公司亚太及日本地区的首席技术官,Par Botes在IT行业工作了17年,而他的前一个身份,则是存储架构、大型商用系统以及超大型数据库存储方面的行业评论家。恰逢见到Par Botes,我们也有了一次更为深入的了解固态硬盘的机会。

构建"0"层存储

Par Botes在谈到固态硬盘的发展时指出,越来越多的集中购买存储的趋势,产生一个必然的现象,那就是越来越多的计算机,或者说是终端使用同一个存储设备,存储越集中,一个存储设备所要提供存储能力的终端也就越多。他认为,对于需要支持的系统来说–无论是几个还是数千个系统,其对存储系统的性能要求是不一样的,因为这些终端所存储在存储设备上的数据价值是不一样的,举例来说,在一个存储系统中,存储了银行的事务数据库和人力资源部的资料,可以很简单预见的是,大部分的工作负载都来自于银行的事务数据库,而不是人力资源部制度规定和人才储备资料,而与此同时,信息的价值也随着时间的变化在变化,数据需要在不同的存储系统之间流动。

因此,Par Botes认为,用户在考虑存储系统时,硬盘并不是其唯一要考虑的因素,Cache、处理器都是用户需要考虑,用户需要也必须根据不同的需求对存储系统的资源进行合理分配,以支持不同的应用,而在厂商这个层面说来,存储厂商也因此必须要提供适合用户需求,成本更低的,具有最佳性价比的解决方案,与此同时,在节能降耗日趋主流的今天,能耗也是不得不考虑的问题。

于是,问题也就摆在了眼前,对于类银行事务数据库后面所支持的诸如外汇买卖、在线证券交易以及大量的数据读写操作来说,用户必须拥有一套能够高效的支持这些在线事务处理应用的存储系统,只有这样才能够保持在线交易业务的顺畅–相比谁也不会在卖出股票时看到电脑显示出如下的字样:后台繁忙请稍后。

对于EMC来说,在Symmetrix DMX-4存储系统中添加固态硬盘,目的就是为了构建一个更加"分层"的存储系统,在引入了固态硬盘之后,Symmetrix DMX-4也就拥有了所谓的"第0层"存储,从而获得了交付实时的容量分配,增强的管理灵活性,并同时提高了总体系统利用率和能源效率。由于这个"固态存储层"响应时间更短,能够服务的计算机更多,读写速度都比传统的系统要高,这些都对于更加细分的用户需求和市场来说具有"每10到15年才出现一次的杀手级优势"(分析机构企业策略集团创始人兼高级分析师Steve Duplessie语)。

而Par Botes相信,正是因为用户的应用的多样性,以及对高性能的需要,用户才会去关心速度更快,响应时间更短的存储产品,而固态硬盘恰好给了用户一个绝好的选择。

在聆听问题时,Par Botes总带着的微笑,好像没有什么问题能难道他 

寿命与价格 二者无忧

在固态硬盘走进企业存储的反对者中,Stephen Foskett是最坚定的人之一,他认为,在寿命方面,固态硬盘还未到走进企业存储的时候,确实,对于固态硬盘来说,寿命仍然是一个桎梏,现在的固态硬盘基于Flash闪存技术,而Flash闪存的每一个写入扇区具有的可写入次数基本上在一万到两万次左右,而对于一个在线事务处理系统来说,可能一分钟就会处理万次的交易数据,因此,在许多业界专家看来寿命是固态硬盘走进企业存储不可逾越的一道山峰。

但是,Par Botes却并不这样认为,因为EMC的Symmetrix DMX-4绝不仅仅是"装上了固态硬盘"那么简单,据Par Botes介绍,在Symmetrix DMX-4中,EMC提供了两大关键技术,一是分布式的随机写入算法,二是Cache。

据Par Botes介绍,首先,与消费市场使用的固态硬盘不同,EMC在企业存储中所采用的固态硬盘性能更好而且寿命更长,与此同时,EMC通过分布式的随机写入算法,将数据随机分布写入固态硬盘中,虽然用户并不会察觉到数据的分布式写入,但是对于Symmetrix DMX-4来说,系统控制的写入位置是分布的–无论是在写入某一个固态硬盘还是固态硬盘内部的每一个写入扇区上,由于这样的分布式写入,用户的读写实际上都避免了在某一块固态硬盘或固态硬盘的某一个写入点上进行集中操作,由此,在Symmetrix DMX-4中,EMC首先避免了写入和读取热点的问题–这对于寿命来说肯定是有好处的。

而第二步,就是Par Botes重点向我们介绍的Cache部分了,Par Botes表示,在Symmetrix DMX-4中存在一个Cache部分,对于这个部分,Par Botes用了"Key Point"这个词,可见这部分对于Symmetrix DMX-4的重要性。他表示,对于固态硬盘和SATS磁盘来说,写入性能肯定是不一样的,因此,为了提高固态硬盘的写入速度,EMC在系统中加入了高速的Cache,数据在写入Symmetrix DMX-4的时候,数据首先写入到了Cache中,由于Cache是高速的,因此,这部分写入是完全同步的,随后数据从Cache写入到固态硬盘中,这部分的写入时异步的,我们看到,实际上,Symmetrix DMX-4的写入是同步+异步的,正是这种模式,使得存储系统的写入时间很短,而存储过程也不会拖累整个系统的写入–"实际上,当数据到达Symmetrix DMX-4的Cache之后,写入就完成了。" Par Botes补充到。我们认为,这样的写入方式,实际上这样就可以满足用户的在线事务系统对于固态硬盘在写入速度上的要求,而异步的写入,实际上也为分布式写入提供了时间,从而间接的保证了固态硬盘的寿命。

而另一方面,在读取时,固态硬盘则有天然的优势–不需要Cache,由于传统硬盘的寻道时间问题,因此传统硬盘需要Cache保证读取速度,但是固态硬盘的读取速度很快,无需Cache,Par Botes表示,在Cache一样多的情况下,固态硬盘与传统硬盘在写入时都需要Cache,而读取时固态硬盘不需要,这会得出一个什么样的结论呢?那就是实际上Cache的"数量"增多了,用户在写入时获得的"可用Cache"增多了,写入性能和读取性能自然比传统设备要高。

在Stephen Foskett眼中,价格也是一大阻碍因素,确实,固态硬盘的价格即使是与同等容量的FC硬盘相比,也要高出十几倍,对于用户来说,这样高的价格确实是有些不可接受的,不过Par Botes的看法却与Stephen Foskett不同,"你的存储系统中不可能只有固态硬盘。"他认为,固态硬盘的作用就是构建一个"第0层"存储,而不是全部替代传统硬盘,因为即使这样,用户已经能够获得高出之前不少的性能了,而价格并未上涨过多(配备4~5个固态硬盘的Symmetrix DMX-4系统价格差不多提高不到10%)。而与此同时,许多用户确实有这方面的需求–实际上,在我们的调查中就有银行表示,由于他们的存储响应时间是毫秒级的,时间要求很高短,往往一年的数据算下来,延迟带来的股票交易损失可多达一亿美元,从这个角度来看,固态磁盘还是相对便宜的。

不过,Par Botes也承认,固态硬盘还存在着CPU占用率过高的问题,一个处理器只能带动4~5个固态硬盘,不过Par Botes并未确认Symmetrix DMX-4中的处理器是单核还是多核处理器,我们相信,在多核处理器日益普及的今天,随着四核甚至八核处理器的出现,固态硬盘的CPU占用率过高的问题,会逐步得到缓解,更何况据Par Botes表示,"每个系统有5到10个固态硬盘就足够了。"而一个Symmetrix DMX-4中最高128个CPU的超高端配置,自然也能够让性能和可扩展性保证用户的需求。

而对于我们提到的混合硬盘(hybrid hard drive, H-HDD),Par Botes显得并不在意,他表示,固态硬盘有确实可靠的性能提高,而混合硬盘不是这样的,混合硬盘有时好有时坏,更多时候还是用在消费级产品上比较合适,对于企业存储来说,混合硬盘还是不太合适的。

在与Par Botes的沟通之后,我突然想到,事实上,固态硬盘技术几乎和虚拟化技术一样古老,日本东芝公司于1984年发明了闪存而INTEL公司在1988年正式将闪存形成商品,而在此之前,固态硬盘在早期的大部分时间里,主要用在军用嵌入系统中,或者高性能计算的研究实验室中,而基于RAM的固态硬盘(我们现在所说的固态硬盘,多数是基于Flash闪存技术的)历史更是悠久,美国军方在其嵌入式设备总早已有所应用。

就像虚拟化技术一样,蛰伏多年的固态硬盘,在现在如爆发式的成长,在技术与产品日趋成熟的原因之下,我们不得不承认,对于固态硬盘,对于更低能耗更高速度的存储的要求"古已有之",正像Par Botes所说的,用户是有这方面需求的。对于固态硬盘走进企业存储的前景,我是看好的,Par Botes是看好的,EMC也是看好的,即使是Stephen Foskett这样坚定的怀疑论者也在自己的blog中承认,他是希望固态硬盘能够早日走进企业存储中去的,可以说,固态硬盘走进企业存储,前途光明。