联想数字图书馆存储系统解决方案

    一、需求分析
  
    1.容量分析
  
    以国内某数字图书馆应用软件的图片格式PDG为例计算,一所大学数字图书馆的总容量:
  
    按照平均每册书有300页来计算,每一页的大小约是35KB,一本书的大小是:35KB/页 x 300页=10500KB≈10.3MB
  
    那么,按照一所大学图书馆现有的藏书量80万册计算:
  
    10.3MB/册 x 800,000册=8240,000MB≈8046.9GB≈7.9TB
  
    几年后这所大学图书馆的藏书量会达到150万册,
  
    10.3MB/册 x 1500,000册=15,450,000MB≈1,5087.9GB≈14.7TB
  
    2.数字图书馆内容分析
  
    数字图书馆显然不会只有图书,它会集成音频、视频、多媒体等各种其它形式的媒体资源,创造出一个前所未有的阅读新空间。例如,读者在数字图书馆查找”红楼梦”,不但可以看到纸本图书的借还书状态,还可以阅读到数字图书、红楼梦音乐以及《红楼梦》电视连续剧等。
  
    如此丰富的媒体资源存放在光纤磁盘阵列上是最合适的,因为光纤磁盘阵列已经被广泛用于多媒体应用环境中,例如:电视台的非线性编辑、小区电影点播等系统。光纤磁盘阵列能够提供很高的持续带宽,在大用户量访问的情况下,依然能够提供较高的数据传输带宽。
  
    3.数字图书馆建设模式分析
  
    电子图书的出现使得用户不必再花费力气将现有的一些通用的书籍进行数字化,从这个角度看,大学的图书馆可以先在选取一些通用的数字图书(大概25-30万册),然后在着手特色馆藏图书的数字化工作。根据这一模式,我们建议客户分阶段进行数字图书馆的建设,第一阶段先满足现有的需求,以选取超星资源库中25万册图书计算,大概需要2.5TB左右的存储容量,按每年图书数字化速度是3万册计算,第一阶系统需要3TB左右的存储容量。以后,可以逐步扩展存储容量。
  
    4.技术分析
  
    我们建议客户分阶段建设数字图书馆,这是根据数字图书馆建设模式和充分保护客户的投资角度来考虑的。从IT行业的发展趋势来看,SCSI磁盘阵列在未来几年逐步被淘汰,而且在服务器中也出现了用FC?AL来替代SCSI总线的产品。从保护用户投资的角度来看,现在如果购买10TB的存储设备,会是一种资源的浪费,通过刚才计算,第一阶段需求是3TB左右,每年会增长300GB—400GB,在加上多媒体资料的增加(按1TB计算),每年的存储需求量会在1.3TB左右,这样要在5?6年后才能达到10TB的容量,随着光纤硬盘的成本不断的下降,可以为用户节省大量的资金。
  
    综上所述,我们建议客户采用以光纤阵列为主的SAN网络。
  
    二、方案设计
  
    1.系统方案设计原则



  • 高可用性

  • 高可靠性

  • 高扩展性

  • 充分保护用户投资

    2.系统方案设计目标



  • 网络连接采用SAN(存储局域网络)架构,保证系统的高性能。可在SAN网上任意增加存储设备,提高系统的存储容量。

  • 系统采用全光纤磁盘阵列产品,保证系统的高性能。

  • 所采用的磁盘阵列产品在结构上及硬件组成上完全是冗余设计(如阵列控制器、内部2条光纤环路、电源、风扇、链路控制器、双口光纤硬盘等),不存在单点故障,确保整套系统的安全运行。

  • 磁盘阵列可采用不同的RAID保护级别,保证用户的不同需求。

  • 存储系统,可提供高可扩展性,可在线扩容,有很好的投资保护。

  • 所有硬件均可支持热插拔,保证系统应用的连续性。

  • 系统升级不必停机,可在线升级。

  • 系统具有良好的开放性,不同厂家产品之间能够互连。系统支持多种主机系统及集群系统。

  • 系统安全性很高,可根据用户的要求,完成数据的隔离或共享。

  • 可通过增加应用软件来支持物理通路的冗余连接,以提高系统的安全性。

  • 可提供远程容灾功能来防止意外灾难引起的数据丢失。

  • 存储产品采用基于Windows的图形管理界面,维护简单。

    三、方案描述
  
    1、基础方案
  



    根据数字图书馆第一阶段的实际需求,我们建议采用联想SureFibre400R2光纤磁盘阵列柜,加上4个SureFibre400J2光纤磁盘阵列扩展柜,总容量可以达到5.5TB,完全能够满足客户数字图书馆项目第一阶段建设的需要。中间采用Brocade SilkWorm3200光线交换机,服务器通过两条FC通道与交换机连接,达到单机双工的要求。这样的设计是为以后扩容作准备。
  
    2、扩展方案
  



    扩展方案是在基础方案的基础上搭建起来的,主要是使用了两个Brocade3200交换机,每台服务器通过两块光纤通道适配卡(HBA),两条光纤线路分别接入到两台交换机上,提供线路冗余;光纤阵列提供两个主机接口,它们分别接入到两台交换机上,以提供线路冗余和提高性能。这时的容量可以达到17.2TB,可以将客户图书馆的所有藏书的电子版都存储起来。
  
    四、方案优势
  
    经过对这所大学数字图书馆项目的实际需求的分析,并从学校的实际情况出发,同时考虑到今后系统的升级问题,特提出以上解决方案。该方案具有以下优势:
  
    1、数据安全性得到了充分的保障,具体体现在:



  • 数据本身的安全

    联想SureFibre400R支持多种RAID等级:0、1、0+1、1+0、3、5,在多数情况下,我们推荐使用RAID5,因为RAID5的硬盘使用率较高、安全性较高的RAID等级。除了RAID等级上的保护之外,我们的阵列还可以根据用户的需求提供多个全局热备份磁盘,一旦阵列中的任何一块磁盘出现问题,全局热备份磁盘都会立即工作,达到保护数据的目的。



  • 阵列控制信息的存储

    一般的阵列其阵列配置信息(包括硬盘分组、RAID划分等信息),都存放在阵列控制器上,一旦控制器出现问题,那么存放在控制器上的配置信息就会完全丢失,即使更换新的控制器控制信息也无法挽回,那么硬盘上的数据就会丢失,给用户造成无法估量的损失。联想SureFibre400光纤磁盘阵列的配置信息都存放在硬盘上,这样即使控制器出现问题也不会影响硬盘上的数据,而且当RAID组中的一块硬盘出现问题,更换新的硬盘后配置信息会自动复制在新硬盘上,确保了数据的完整性和安全性。



  • 逻辑设备的有效隔离

    联想SureFibre400光纤磁盘阵列支持现在流行的绝大多数UNIX操作系统,WIN NT和WIN2K以及NetWare操作系统,它是一个真正的跨平台的磁盘阵列系统。由于我们的磁盘阵列支持多种操作系统,为了使安装了不同操作系统的服务器连接到阵列上不会识别到所有的逻辑单元,我们的管理软件提供了SANMapping模块,这个模块允许你通过主机的World Wide Name(WWN)来控制开放系统主机对逻辑单元的访问。你可以限制某个或某些主机对这个LUN的访问。这个功能可以使其他主机看不到被保护的LU或无法访问存在其上的数据。SureFibre400的SANArray Manager管理程序为SANMapping功能模块提供用户界面。
  
    2、数据集中存储和管理
  
    我们设计的基础方案和扩展方案都是构建在SAN网基础上的,那么我们的方案就体现了SAN网络的最大优势和特点:数据集中存储和管理。联想SureFibre400光纤磁盘阵列自带一套磁盘阵列管理系统,统一管理系统上的数据,提高了管理效率,而且可以在这个基础上通过第三方软件提供诸如快照、同步/异步复制等应用。
  
    3、SAN(存储局域网)中的所有硬件设备,磁盘阵列、交换机都是按客户实际需求配置,并充分考虑到设备的安全性和可扩展性。整套系统可通过在线升级来满足客户的不同需求。
  
    4、可以通过改变硬件配置,网络连接方式提高网络性能。
  
    5、通过增加网络设备,存储设备来进一步增加网络容量,扩大SAN规模。