XtremIO Data Protection (XDP)重构性能

存储在线专栏文章:今天我继续来分享一下XtremIO采用的数据保护方法XDP,特别是其重构性能。

如果大家学习过西瓜哥前面用切西瓜的方法讲的RAID 2.0,也比较容易理解XDP。

XtremIO把每一个X-Brick当做一个单位,一个砖就是25块盘。我理解就是每块盘切成4KB大小的数据块,每块盘取1个块,组成一个23+2的RAID 6。可以理解为是RAID 2.0的一种特例。因此,重构的时候具有RAID 2.0重构速度快的优点,除了没有性能瓶颈外,重构的数据也少了(因为切到4KB的粒度,就能够感觉每个4KB是否有数据,有数据才需要重构)。但是23+2,还是需要做比较多的XOR计算,对CPU的资源消耗理论上应该蛮大的。

我们来看一下XtremIO的重构测试结果。

测试环境:
存储操作系统版本:XIOS v2.20

IOmeter工作负载:
48 workers (2 VMs per host, 8 workers per VM, 8GB RAM)
70% write 30% read
100% random
4K block size
4K offset
16 outstanding I/Os
System setup: XtremIO cluster consisting of two X-Bricks

一共有两台X-Brick,西瓜哥从容量的减少情况判断,应该是采用300G的SSD硬盘。

1、从每块砖上都拔下一块SSD盘,跑4个IOmeter VM。重构的时候,IOPS是250K:

2、重构完成后,增加两个IOmeter VM,IOPS达到330K:

3、这个时候每个砖再拔掉1块SSD,重构时的IOPS是240K。重构时间是5分钟。

4、重构完成后,性能恢复到330K。可以看到物理容量减少了,但性能没有下降。但第3-4块盘的重构时间花了9分钟,比原来的拔第1-2块盘5分钟的重构时间长,应该主要是负载重了的缘故,因为多了两台VM:

5、再继续每块砖拔一块SSD(即第5-6块盘),发现和拔3-4块基本一样,重构时是240K,重构完成后恢复到330K,重构时间也是9分钟,可用空间进一步减少:

6、在继续拔第7-8块盘,结果同上:

7、第7-8盘重构完成后,性能也恢复到330K:

8、继续拔第9-10块盘,结果差不多,只是重构时间略微长了一些,变为10分钟:

在测试过程中,观察VMWARE的性能情况。发现重构的时候时延是增长的,并且没有控制在1ms之内,但还是比较小的:

前面我们看磁盘拔掉对性能的影响,我们下面再看一下更换磁盘后对系统性能的影响。

先每一个砖换一块SSD盘。这个时候系统的性能临时降到260K IOPS,时间大约是1分钟。当XDP恢复进度达50%后,性能恢复到原来水平:

后面再每次一个砖更换一块盘,一直更换完所有的坏盘。每次换盘的测试结果都类似,大约有1分钟的性能下降:

从上面的测试可以看出,XDP针对全闪存的情况下,确实有重构性能下降不大,但磁盘的利用率较高的优点。

而且,容量的减少,对性能影响不大,这就是XtremIO宣传的一致性性能。

XDP也是一种类似RAID 2.0技术,只是CK粒度更小,配置固定(23+2),利用率更高些。期待华为的基于RAID 2.0的全闪存阵列的测试数据,到时候可以做一个比较。总的来说,这种RAID 2.0技术和纯SSD应该是一种绝配,因为数据可以自动均衡,没有热点,可以延长SSD的寿命。

希望大家积极反馈你的意见和建议,微信扫描如下二维码,关注微信公众号“高端存储知识”,与作者微信互动。通过掌上DOIT移动客户端,您可以订阅西瓜哥专栏,第一时间获得知名专家和业界领袖的深度剖析与趋势分析。