DoSTOR存储分析 5月14日消息:本文作者Henry Newman是国外某知名存储网站的资深编辑。在同用户的沟通中发现存储的费用不仅仅来自于驱动器和RAID控制器等设备,设备电耗以及冷却系统同样需要花费数据中心的大量预算。下面我们同作者一起来看看存储的真实耗费,本题分为两篇,这是第二部分。
在本文的第一部分中,我们首先对比了光纤信道(FC)与SATA的真实成本差异。
我认为,在那些对性能要求高的环境中,SATA的成本比光纤信道或者新型SAS技术的成本要高一些。 虽然根据性能或者容量的不同,SATA可能会比光纤信道便宜三分之一到90%,但是还需要考虑其他一些问题,那就是我们现在要讲的内容了。
在今年早些时候举行的USENIX FAST会议上,发表了两篇关于驱动可靠性的耗文章,其中一篇谈的是现实生活中的磁盘故障,另一篇讲的是谷歌公司的经验。
我从这两篇文章中得到了两个重要的东西。其一是,RAID控制器中的磁盘驱动器上并没有象驱动器厂商所说的可靠性说明,SATA驱动器的可靠性也远远不如光纤信道或者SAS。
这可能是由于RAID驱动器厂商认为问题刚一出现就应该认为驱动器已经出故障了,比如驱动器未按厂商规定的特殊响应超时系统作出响应,但是它可能仍然可以运行较长的时间并自动从错误中恢复。例如,如果驱动器在几秒内没有回应,我认识的某些厂商会说驱动器已经出故障了,然后将它拆下来修理,但是很可能那个驱动器最后还是会回应。 磁盘驱动器厂商不会因为驱动器最终作出了回应就认为它没有出故障。
需要考虑的另外一个东西是IOPS(输入输出程序设计系统)。SATA和光纤信道的随机IOPS比率在每秒兆字节性能差异、真实性能和完善后的搜索和延迟性能等方面是差不多的。 因此,同理我认为在相同的IOPs条件下,光纤信道驱动器仍是一个比SATA驱动器更好的选择。
数字和要求
由于FAST研究中使用的磁盘驱动器大部分都是旧技术下的产品,所以我不打算使用FAST研究报告中的数据,但是我认为驱动器的使用寿命不会象驱动器厂商所说的那样长的概念还是有用的,因为正如加思吉布森在FAST研究报告中所说的那样,RAID厂商在驱动器性能和响应时间上留出的余地比驱动器厂商要大得多。
在希捷公司网站上,他们宣称对于15k光纤信道驱动器来说,年故障率为0.62%。
不久之前,在同一个网站上,他们是用时间来表述这个指标的,当时他们说的是120万小时。为了便于对比讨论,我们就用许多RAID厂商使用的50万小时来进行对比。 那么RFID驱动器的年故障率就达到了1.49%。
根据希捷公司提供的数据,SATA驱动器的年故障率是0.73%。
让我们根据网站上使用的数据假设将它转化为100万小时,并且假设RAID厂商说的是50万小时和30万小时。我想据我所见,那些驱动器可能在使用了30万小时之后就会出现故障了,而根本不会等到使用了50万小时之后才发生故障。 因此,对于50万小时来说,它的年故障率为1.46%,对于30万小时来说,年故障率是2.44%
将所有的问题都整理在一起
请记住,我推测不管采用IOPS还是流,SATA在各种性能环境中的成本都要更高一些。
以下数据是在2007年3月和4月从厂商网站上获得的:.
驱动器类型 | 厂商 | GB | 弹性系数 | 每分钟转数 (单位:千) | 空载功率 | 荷载功率 | 平均值MB/S | MB/S瓦 |
光纤信道 | 日立 | 147 | 3.5 英寸 | 15 | 8.92 | 12.02 | 93 | 7.7 |
光纤信道 | 日立 | 300 | 3.5 英寸 | 10 | 10.8 | 13.4 | 91 | 6.8 |
光纤信道 | 希捷 | 300 | 3.5 英寸 | 15 | 13.7 | 18.8 | 99 | 5.3 |
光纤信道 | 希捷 | 147 | 3.5 英寸 | 15 | 10.7 | 16.5 | 99 | 6.0 |
SAS | 希捷 | 73 | 2.5 英寸 | 15 | 5.8 | 8.2 | 95.5 | 11.6 |
SAS | 希捷 | 146 | 2.5 英寸 | 10 | 5.2 | 7.8 | 72 | 9.2 |
SATA | 希捷 | 750 | 3.5 英寸 | 7.2 | 9.3 | 13 | 78 | 6.0 |
此表为驱动器对比 |
年故障率 | 1.49 % | |
4 + 1 | 8 + 1 | |
300GB 光纤信道 15K 无年故障率 | 17067 | 15360 |
每年故障次数 | 254 | 229 |
可能一天2次 | 69.67 % | 62.70 % |
此表为RAID故障率 |
由于性能对HBAs和接线器端口提出了功率要求,以下是数据路径技术的某些功率要求:
QLogic 双端口 4GB HBA要求6.5瓦。公司网站没有提供BTU参数。
适用于48口刀片式服务器上的各个4GB端口的思科9500系列导向交换机使用16.46瓦,为了冷却产生的热量,需要配置3个BTU。
以下是某RAID厂商提供的关于16驱动器的托架和控制器参数:
• 每个控制器大约要消耗60瓦功率
• 带有16个希捷500GB Tonka-2 SATA驱动器的驱动器托架要消耗375瓦功率
• 带有16个4GB 15K.4驱动器的驱动器托架要消耗382瓦功率
• 各需要冷却的热量与驱动器数量和容量有关(一般驱动器容量越大,需要的功率越大)
o 16个500GB希捷SATA驱动器=1283BTUs
o 16个146GB希捷4GB光纤信道驱动器=1300BTUs
你不难发现同样的数量时,光纤信道托架的功率是118瓦(382-(16*16.5)),而SATA托架的功率是167瓦(375-(16*13))。 这可能是因为所需的附加SATA控制器与光学光纤信道连接器一样需要耗费功率。这样,光纤信道驱动器的功耗就增加了31%,SATA驱动器的功率就增加了45%。
举个例子
让我们假定你需要你的企业需要100GB/秒的全天持续性能。实际上如今企业需要的持续性能远不止这么多。 对于某些读者来说,这可能已经是个很高的要求了,但是对于银行、保险公司、汽车制造厂、制药公司或者任何大型企业来说,这个要求是不算高的。让我们来计算一下你要为磁盘驱动器配备些什么。
对于光纤信道驱动器来说,我将根据厂商提供的资料来计算,每个驱动器的最小传输速率为75MB/秒,我预计不管使用那种类型的驱动器,它都是最大性能的55%左右。这些数据都是依据各厂商网站上的数据得出的。 驱动器数量和年故障率都假定如上表所示。
年故障率 | 1.46 % | |
4 + 2 | 8 + 2 | |
750GB FC 15K no AFR | 35721 | 29767 |
每年故障次数 | 522 | 435 |
可能一天2次 | 142.88 % | 119.07 % |
此表为SATA故障率 |
根据这些资料和返修的时间,根据我的预计以及性能要求,返修时间可能从4小时到12小时不等。我想你可能需要再加两个4+1或者8+1来确保达到性能要求,这样RAID 4+1的总驱动数就达到了17077,RAID 8+1的总驱动数就达到了15378。注意,这并不包括热备件。
增加的两个LUNs将需要同时增加两个HBAs和接线器端口以及一个RAID控制器,我没有增加这些东西,但是你应该记住实际上是需要增加它们的。
对于SATA来说,新的数据如下:
年故障率 | 2.44 % | |
4 + 2 | 8 + 2 | |
750GB FC 7.2K no AFR | 35721 | 29767 |
每年故障次数 | 872 | 726 |
可能一天2次 | 238.79 % | 198.99 % |
此表为新的SATA故障率 |
鉴于一天之内可能发生多次故障,以及为了让FC也达到相同的故障次数,根据性能要求,我估计你需要增加5个LUNs才能达到1.46%的年故障率,或者增加8个LUNs才能达到2.4%的故障率。
如果年故障率为1.46%,RAID 4+2的磁盘总数就达到了35751个,RAID 8+2的磁盘总数将达到29817个。
如果年故障率是2.44%,RAID 4+2的磁盘总数就达到了35801个,RAID 8+2的磁盘总数将达到29847个。
因此,从纯粹功率的角度来看,你需要的驱动器如下:
光纤信道 | 数量 | 每个驱动器的功率 | 总功率(单位:千瓦) |
1.49 % 年故障率 | |||
RAID 4+1 | 17077 | 18.8 | 321.05 |
RAID 8+1 | 15378 | 18.8 | 289.11 |
SATA | |||
1.46 % 年故障率 | |||
RAID 4+2 | 35751 | 13 | 464.76 |
RAID 8+2 | 29817 | 13 | 387.62 |
2.44 % 年故障率 | |||
RAID 4+2 | 35801 | 13 | 465.41 |
RAID 8+2 | 29847 | 13 | 388.01 |
此表为功率消耗 |
光纤信道 | 数量 | 每个驱动器的功率 | 总功率(单位:千瓦) | 耗费.09每千瓦时 | 每年成本 | RAID控制器方面的年成本 | 5年 功率成本 | RAID 5年功率成本 | 5年成本 差异 | RAID5年 成本差异 | |
1.49 % 年故障率 | |||||||||||
RAID 4+1 | 17077 | 18.8 | 321.05 | 28.89美元 | 253113.93美元 | 331579.25美元 | 1265569.64美元 | 1657896.23美元 | |||
RAID 8+1 | 15378 | 18.8 | 289.11 | 26.02美元 | 227931.49美元 | 298590.25美元 | 1139657.43美元 | 1492951.23美元 | |||
SATA | |||||||||||
1.46 % 年故障率 | |||||||||||
RAID 4+2 | 35751 | 13 | 464.76 | 41.83美元 | 366419.15美元 | 531307.77美元 | 1832095.75美元 | 2656538.83美元 | 566526.11美元 | 998642.60美元 | |
RAID 8+2 | 29817 | 13 | 387.62 | 34.89美元 | 305600.40美元 | 443120.57美元 | 1528001.98美元 | 2215602.87美元 | 388344.55美元 | 722651.64美元 | |
2.44 % 年故障率 | |||||||||||
RAID 4+2 | 35801 | 13 | 465.41 | 41.89美元 | 366931.61美元 | 532050.83美元 | 1834658.05美元 | 2660254.17美元 | 569088.41美元 | 1002357.94美元 | |
RAID 8+2 | 29847 | 13 | 388.01 | 34.92美元 | 305907.87美元 | 443566.41美元 | 1529539.36美元 | 2217832.07美元 | 389881.93美元 | 559935.85美元 | |
此表为总功率成本 |
这些数据并不包括拆除BTU的成本,加上这部分成本后,功率成本可能会增加三分之一左右,从而进一步缩小它们之间的差距。
驱动 | 驱动器数量 | 原始成本 | 驱动器5年的成本 | RAID驱动器5年的成本 | 不同时期的真实成本差 | 不同时期RAID真实成本差 |
FC4+1 | 17077 | 17077000美元 | 18342570美元 | 20000466美元 | ||
FC 8+1 | 15378 | 15378000美元 | 16517657美元 | 18010609美元 | ||
对于1.46%的年故障率 | ||||||
RAID 4+2 | 35751 | 9617019美元 | 11449115美元 | 14105654美元 | 1.60 | 1.42 |
RAID 8+2 | 29817 | 8020773美元 | 9548775美元 | 11764378美元 | 1.73 | 1.53 |
对于2.44%的年故障率 | ||||||
RAID 4+2 | 35801 | 9630469美元 | 11465127美元 | 14125381美元 | 1.60 | 1.42 |
RAID 8+2 | 29847 | 8028843美元 | 9558382美元 | 11776214美元 | 1.73 | 1.53 |
此表为新的总功率成本 |
加上附加驱动器、控制器和接线器端口在内的总功率和冷却成本使得SATA不再是成本最优的选择SATA驱动器的价格可能要便宜90%,但是当加上所有的成本之后,SATA就没有什么成本优势了。在进行对比分析时我们没有将BTU拆除或者附加控制器和接线器端口(以及那些项目的功率和冷却成本)的成本计算进去。
驱动器成本是从我最新研究报告中提取的,最低价格则是我在froogle.com上查到的。你看见的内容并没有将增加的RAID控制器的一系列成本计算在内。 它也没有考虑额外增加接线器端口、HBAs和冷却这些附加设备产生的热量所耗费的功率。
记住,这些对比分析的前提都是在性能优先的环境下。我认为我一开始的直觉似乎是正确的,即在各种性能优先的环境下,SATA的成本效益并不明显;FC或者即将推出的SAS驱动器倒是一个更好的选择。 我在计算中没有包括冷却热量所需的BTU、额外附加的HBAs、接线器端口的相关成本和那些配件附带的功率成本。也没有考虑功率成本今后的发展变化因素。
我想让你自己来做决定,但是我自己仍然强烈建议在性能优先环境下不要选择SATA驱动器。