华为助力汕头大学存储系统建设

教育行业一直走在信息化的前沿,高校以网络化、现代化的教育方式,通过网络对外提供教育资源服务,很多教育资源关键数据都存放在学校的信息系统。随着数字化和网络化进程的发展,信息化的应用影响和改变着教育行业的工作、学习以及思维的方式。一卡通、数字化图书馆、OA办公系统等各类业务的发展,都对信息系统的要求越来越高。如何把各种不同业务系统的信息加以整合?如何低成本实现各部门信息共享?建立一个有序高效的数据存储结构,保证数据的可用性和易管理性,满足多种应用系统的高效运行,实现最优TCO的存储整合,是当前教育信息化需要考虑的问题。

发展遭遇瓶颈

汕头大学是1981年经国务院批准成立的广东省属“211工程”重点建设综合性大学,作为教育信息化推行较为完善的高校,目前校园网络基本能够满足业务的需求。而新建的数字图书馆业务成为汕头大学信息化发展的重要路标。此次项目系李嘉诚先生捐巨资兴建,旨在为学校师生提供学习、交流、信息查询及获取

的平台,是一座以自动化、数字化和信息化为标志的现代化图书馆。新图书馆功能布局完善,标配有阅览室、数码图书库、在线学习等业务系统。丰富多样的业务,要求配备一套完善有效的IT资源,包括网络、计算、多媒体、数据等等。

规划初期,汕头大学考虑新图书馆数字化业务采用原有网络中心的IT系统来承载。但经过调研发现,图书馆存在的电子期刊、报纸会议技术报告、音频数字媒体、文件传递等应用有非常多的非结构化数据;并且文件存储时间较长,数据总量较大,I/O请求相对较少。因此,目前网络中心存在的SAN系统容量扩展和存储方式的局限无法保证这部分海量文件数据的存储。另外,图书馆书目信息集成管理系统、特藏库、知识库等系统则运行在数据库上,I/O请求频率较高,要求网络中心IT系统分配较多的计算资源给这些结构化数据。如果借助原来有限的IT平台资源,新图书馆的业务将会受到限制,在I/O访问频率和存储容量都会受到非常大的影响。最终,汕头大学确定需要新购置一套专业的高性能存储,以便能够按照统一管理的思路,提供高性能的计算和大容量的扩展。

深入探索需求

华为经过多次沟通了解到,汕头大学网络中心希望建立集中独立的存储系统,既能对结构化数据(运行在数据库的数据)进行高效管理,又能对非结构化数据(文件数据)进行海量存储。在这种思路下,所有的信息资源都存储在独立的信息存储资源中,用统一的技术手段对信息进行管理和开发。这样,一方面新图书馆业务产生的所有数据能够进行统一的管理,另一方面,后续可以把整个网络中心的其他业务也切换到高性能的存储新平台,使各个业务应用之间实现互相协同,提高工作效率。在数据的保护性方面,则希望新建的存储系统通过系统自带的增值软件功能,比如快照、拷贝等,实现基于系统本身的数据保护。而对未来的容灾中心的建设,也是需要基于此次建立的存储系统。因此,如何保证后期投入的可持续性和平滑扩展,需要在项目建设有一个非常详细的规划。

除了在整个架构上做好规划,还需要考虑到业务的应用优化。经过多次沟通了解到,汕头大学图书馆的负责人想解决峰值情况下存储性能瓶颈的问题,比如在每年毕业生写论文阶段某些论文库访问非常频繁,导致整个系统非常慢。虽然配置高性能的FC存储介质可以提升性能,但是过了这段时间,此类资源访问减少,FC存储介质便无法发挥它的高性能优势,造成了很大的浪费。这也是新图书馆业务需要完善和优化的地方。

由于汕头大学和李嘉诚基金会的密切合作关系,此次李嘉诚基金会也会参与到此系统规划中。在整个IT系统TCO(Total Cost of Ownership)把控的关键环节,李嘉诚基金会希望建立的存储系统既能满足现有的网络需求,又能保证后续的系统扩展,不希望造成投资的浪费。

统一存储解决方案让问题迎刃而解

根据汕头大学的需求,华为赛门铁克建议构建新图书馆的业务平台,以优化TCO为原则,构建一套统一存储系统。通过两台FC交换机构成核心的SAN存储环境,通过FC SAN的架构,将本地的多台服务器和刀片服务器连接到磁盘阵列,构成服务器与阵列之间通道连接。刀片服务器则通过本身自带的交换机实现SAN。不同的数据库业务和虚拟机业务根据业务的可靠性级别,采用FC SAN或者IP SAN,配置性能和可靠性较高的FC硬盘,实现数据的分级存储。而部分图书馆业务系统如期刊论文、多媒体资料库等文件应用由于数据量非常大,根据时间周期、数据使用频率和I/O读写速度的不同要求,则采用统一存储的NAS方式存储,配置部分高性能存储介质FC硬盘和大量成本低廉但容量很大的SATA硬盘。这样,根据数据生命周期的不同,能够实现最优性能的文件访问。

该方案采用华为统一存储

平台N8300,作为业界性能领先的NAS、IP SAN、FC SAN融合存储,其最大7PB的容量和最高8个集群节点的扩展,使得构建汕头大学高性能大容量统一存储系统成为可能。系统由前端的集群存储引擎和存储单元组成,前端的图书馆业务服务器产生的非结构化数据应用通过CIFS或NFS文件传输协议进行读写,结构数据采用FC SAN或IP SAN做数据块(Block)的读写,兼容所有类型的客户端、应用程序和网络。海量数据图书馆、特藏网、知识库、虚拟教室等应用以FC SAN方式来存储;图书馆的业务系统如超星电子图书、多媒体资料库、报纸会议技术报告数据库、学术期刊论文、学位论文几种业务,以CIFS共享方式实现存储。整个系统配置了20块450G的FC硬盘和34块1TB的SATA硬盘。对于FC SAN方式存储的数据均存放在FC硬盘,而通过NAS方式存储的数据则通过DST(自动分级存储)功能实现FC硬盘和SATA硬盘的智能分级存储。系统可以按照时间阶段自动按文件访问频率进行统计,访问频率排在前几位的文件,将自动迁移到读写性能较快的FC硬盘中,访问较少的文件则自动存放在性能稍差的SATA硬盘上。智能化的分级存储使得图书馆业务得到了优化,一些热门的图书资源可以很快地进行访问,从而实现了数据生命周期的自动管理。

而N8300自带的增值功能如快照、拷贝等,可以把一些重要数据进行多份保护,实现数据的多重存放。本身基于SAN和NAS的复制功能,为以后容灾中心的平滑过渡提供了保证,能够快速地部署基于数据级别的容灾系统。整套方案满足了汕头大学的技术需求,在TCO方面实现了优化。初次增值软件的配置实现了最优的数据保护方案。

四大特点保证TCO最佳优化

两个架构,一套管理

仅用一套存储实现了NAS和SAN两套存储架构的搭建,FC硬盘和SATA硬盘的自动智能分级应用无需人员参与。管理员仅需要对单套设备进行管理,极大地降低了维护成本。

集群技术,优化性能

集群节点技术保证性能线性增加,最高性能可到70万OPS,保证了业务的数据读取性能。利用集群技术,还可以实现前端节点的负载均衡和业务分担,保证了系统可靠性。

高扩展性,确保无缝扩容

最大7PB的容量扩展,满足了学校业务的容量需求,内置的快照、拷贝、备份等软件可以实现数据的本地保护,基于NAS和SAN的复制软件,能够帮助远程容灾中心实现数据级容灾,为将来的扩展提供了强有力的支撑。

生命周期信息管理,实现应用优化

业务应用中,可以根据信息的生命周期(产生和使用的周期)进行分类自动化管理,访问频率多的信息自动提高读取性能,在应用优化的同时实现了最优的投资保护。

经过多次测试和现网环境模拟,华为和汕头大学不断深入沟通,优化方案。目前汕头大学统一存储系统已经实施完成,网络中心各业务都对接到该系统,新图书馆的业务也得到了很好的支撑,业务系统已经在该系统的保障下顺利运行。系统在实现海量存储管理的同时, 其FC SAN、NAS的统一存储架构保证了TCO优化,其随需而变、线性增长的性能和容量解决了未来信息化发展的问题。此次存储系统的搭建,通过不断的进行TCO优化,成为汕头大学推进教育信息化的一个重要里程碑。