存储架构:寻找在线和离线的中间点

    传统存储架构采用的是两级平台:在线存储和离线海量存储。在线存储又称工作级存储,采用高速数据存储设备,满足计算平台对数据访问的速度要求。一般在线存储有磁盘阵列等,价格相对昂贵。 
  
    离线海量存储主要是用于对在线存储的数据进行备份,以防范可能发生的数据灾难,因此又称备份级存储。离线海量存储的典型产品就是磁带库,价格相对低廉。 
  
    企业存储面对的诸多问题直接导致了近线存储的诞生。近线存储就是近似在线的存储,其特点是数据访问的速度接近在线存储,但在价格上接近离线海量存储。 
  
    最早的近线存储产品是采用光盘来实现,但这种方法并不彻底,其读写机制还是存在着许多的问题。随后出现的近线存储产品采用ATA磁盘来充当存储介质 ,这样就可以有效地降低存储产品的成本,同时又保留了磁盘随机访问的特点,加快了读写的速度,使之达到了保证数据能够被及时访问的目的。



    因此,现在流行的存储平台构架应该采取三层的模式:第一层是在线存储;第二层是近线存储;第三层是离线海量存储。 
  
    随着数据量的急剧增长,传统的两级模式已经越来越不能应对企业因数据膨胀而带来的许多问题:



  • 当企业意识到数据如果能够被快速可靠地访问,将会有效地增加企业数据的价值时,企业就会考虑增加在线存储的投资,但这会导致企业IT预算急剧增长。

  • 企业数据备份无论采取何种方式,都会对业务服务器的性能或服务时间产生影响。而且由于备份和恢复是非对称的两个过程:备份的作业负载可以平分到多台磁带驱动器上,但恢复的作业却往往只能够从某一台磁带机中进行。这样企业单纯增加在备份方面的投资,并不能够减少数据在恢复时的时间,企业的业务延续性也得不到改善。

  • 有效地对数据进行整理会减少存储的空间浪费,同时会有利于提高系统的性能。但人们往往只是喜欢生产数据,而不习惯对自己的数据进行整理。即使能够意识到整理的重要性,也难以保证在整理当中不会把有用的资料删除掉,数据有效性的识别与筛选同样是一项硕大的工程。

    在应用中,除了解决数据备份和恢复的问题以外,近线存储还扩展到保护企业业务延续性、归档利用、混合存储管理以及资料库应用的范围。其优点有:



  • 改善备份和恢复的策略:数据的备份不再直接备份到磁带,而是备份到近线存储设备。通过软件把在线存储上改动的数据块复制到近线存储上,而原来每天需要进行的磁带备份工作可以改为每周甚至更长的时间进行。此时如果要进行数据恢复,也只需简单复制所需的文件回在线存储就可以了。

  • 提高业务的延续性:企业的数据可以通过相应的软件构建起容灾系统。当灾难发生时,由于采用和磁带不一样的介质,恢复的速度会更快,有利于企业业务延续性的提高。这点尤其在数据逻辑灾难发生的时候显得更为重要。