HP公司推重复数据删除技术 企业级用户之所需

惠普(HP)将数据重复删除技术推进虚拟磁带库, 惠普网络储存解决方案事业处储存方案产品经理萧舜华表示,将在今年第二季,令虚拟磁带柜(VTL, Virtual Tape Library)VLS 6200和6600系列,开始支持重复数据删除技术(Data De-duplication)。萧舜华指出,前者系让虚拟磁带柜的管理软件,以加购软件授权的方式,增添重复数据删除功能。不过由于是由控制器的硬件层次支持,所以较一般由备份软件启动的重复数据删除技术更为稳定。

但是也由于是在虚拟磁带柜端启动,因此难免会拖累控制器的部分运算效能。

萧舜华表示,企业用户若是有增购需求,理论上来说成本会增加两成。萧舜华强调,添购成本和实际减少的数据量,仍须视企业本身的数据量及重复频率多寡而定。看准重复数据删除应用的前景,萧舜华表示,未来惠普推出的虚拟磁带柜,都将支持前者。

重复数据删除技术,意指扫描作业服务器(production)磁盘数据,判断数据是否为「重复」或「冗余」。原理是以算法切割磁盘里的数据成为区块(Block)或是区段(Segment),并为每一个分割单位求出一个特征值(unique ID),即可以代表此区块的数据。

藉由这个特征值,系统就可以比对硬盘中已有数据新写入数据之间,是否具有相同之处。若是一致,即代表这笔数据为重复写入,系统便只会为这份数据留下一个索引(index),而不会重复储存占有磁盘空间。换言之只有特征值不同的数据才会被实际写入硬盘。

多间储存大厂都有推出相关技术,包括了EMC、NetApp等。根据EMC的估算,重复资料删除技术能将每日备份数据量减至300分之一,备份时间则可减少至10分之一。

鉴于上述优点,储存厂商即将重复数据删除技术列为今年的发展重点之一。EMC资深技术顾问叶嘉昌在先前的采访中即表示,这可以帮助企业应付与日俱增的数据量。HDS技术长Hu Yoshida 在预期今年对企业界影响最大的十大科技趋势时,亦提及各大备份系统供货商将建置重复数据删除功能,因为前者对排除复制备份数据特别有效。能减少数据份量达20到30倍。其它的删除重复数据方式,例如single instance store归档与copy on write快照也将更为盛行

不过,由于重复数据删除技术的建置成本不斐,加上数据量在TB等级的大型企业才会审视此类需求,目前在本地市场,重复资料删除技术尚未开花结果。EMC软件事业处资深技术经理蓝基能即坦言,该公司的重复数据删除产品如NetWorker和Centera锁定的是金字塔顶端的大型企业用户。

「硬盘容量越来越大,也让企业用户意识不到节省储存空间的需求,」萧舜华说。她表示继去年推出750GB的ATA硬盘后,今年将迈向更大容量的1TB硬盘。