北京大学 远程灾备消解校园信息安全风险

      随着信息化建设的深入,网络技术的普及,我们的生活和工作方式发生了巨大的变化。E-mail代替信件成了人与人沟通的主要信息来源,缩短了人们通信的时间,拉近了彼此间的距离;教学部门通过教务等管理系统解决了学生、教师、教室等多方资源的冲突问题;学生们通过校园网不仅能够了解自己在学校的学习情况,还能够从各种途径获得对自己有益的资源书籍、论坛、blog等,拓宽了自己的知识面;教师们通过各种信息化手段缩短了与国际先进思想的差距,加快了科研及教学的步伐……所有这些都与信息化工作的深入和展开是分不开的,在信息化给我们带来各种便利的同时,我们也发现,随着信息化建设的逐步深入,对其的依赖性也越高,我们的信息化建设也不断受到各种因素的干扰,从最初的计算机病毒到网络病毒、还有成天让信息化主管们提心吊胆的计算机黑客,一旦发生信息化系统的故障,尤其是作为信息化基础的数据丢失,将产生灾难性后果,对我们工作与生活的影响也是空前的,因此信息化越深入,数据的安全控制就越应该得到重视和加强。

    作为中国最高学府之一的北京大学,信息化工作起步较早,其建设的脚印已经深入学校的每一个角落。经过20年的信息化基础建设,北京大学已拥有近5万多计算机用户、1.5万亿次的高性能计算能力、10G的网络主干带宽、网上办公系统、教务教学管理、财务管理等20余种校务管理系统已经推广使用,北京大学的教学、管理及科研工作已经离不开信息化技术的支持。

    在信息化实施的过程中,北京大学也遇到了其它部门遇到的相同问题——信息安全。但受资金及安全观念所限,在最初的信息化建设中很少考虑数据的安全,尤其是数据的直接物理承载体——硬盘的故障。

    据北京大学计算中心2002~2003年的技术统计,其管辖的服务器群就有15块硬盘毁坏,导致部分数据丢失和系统工作的停滞,也正因为如此高的磁盘系统的故障率,数据安全得到了有关方面的高度重视。学校有关领导已经预见到数据将成为信息化建设的基石,在未来的一段时间内,数据安全将成为信息化建设的关注点。

    于是,计算中心自2003年开始了对该课题的探讨和研究工作,并最终通过“211”二期项目的建设,建立起北京大学信息与网络数据中心(含灾备中心)。通过该项目的建设,北京大学的信息化主导部门的主要数据得到了最完善的保护。

    谈到数据安全问题,就不得不提到2005年刚刚开始实行的国家信息化等级保护体系的建设,其对目前信息化建设中存在的安全风险作了较为详细的分析,其间信息安全以层次划分,分为5个层面,即:

    a)管理人员的安全(人员的安全管理、系统地安全健康等等);

    b)各应用的控制安全(各种应用级);

    c)系统的安全管理(操作系统及基础应用级);

    d)网络环境的安全控制(协议级);

    e)数据环境的安全保护(硬件级)。

    其考虑的核心内容是对数据的保护,因为数据是信息系统的最重要的资产,信息安全的最终目的是保护数据不损失、不失窃。通过各种途径(如人员的账户强制管理、应用的补丁、系统的补丁及加固、防火墙、硬件设备的冗余结构等)在不同层面形成对数据的安全控制和保护,实现信息安全的最大化。通过以上5个层面的安全控制,实现数据的安全可控制、可管理、可伸缩、可恢复。

分步实施数据保护整体规划

    北京大学数据中心建设参照信息安全等级保护的规划,突出了对数据的承载体——磁盘系统的保护。通过高可靠的SAN存储网络与智能存储的搭配,配合备份软件和高速带库,共同搭建北京大学信息与网络数据中心,通过长程光纤实现了数据远程灾备,并最终达到:

    1.搭建集中式冗余SAN路由环境,分散式SAN网络,分布到各主要机房和应用的SAN网络,使SAN网络延伸到校园内光纤能够到达的地方;

    2.安全高效的集中式存储,解决了数据存储载体的安全和性能问题,也解决了容量问题,并且通过这种方式实现了主机系统的快速切换;

    3.分区分级的数据存储,通过不同性能的存储系统的使用,达成业务数据和资源数据的分离,实现各类数据的分类存储和保护;

    4.备份软件和高性能带库实现了数据的集中备份,通过网络延伸到校内各地,极大提高了北京大学整体的数据保护能力;

    5.异地数据灾备系统,提供了大容量的远程数据实时复制,最大限度地实现了关键数据的保护,减少极端条件下的数据损失,加快数据和应用的恢复能力;

    6.提高了系统管理人员的安全意识,改变了人员对安全的认识,实现了管理规划化。

    从数据集中存储到数据灾备和备份的各体系的建设,通过不同系统对数据性能和安全的要求,区分数据类型,进行分区分片存储,对关键数据进行合理的自动化备份,对核心数据进行远程灾备,极大地提高了北京大学信息系统的抗干扰能力。尤其是数据灾备,对于高校来说还是一个很富有挑战性的题目,其技术难度和管理难度都很大,投入也是巨大的。因此北京大学对该项目执行调研优先、分步实施、不断改进的方针。项目一期建设主要进行了数据集中存储,集中备份、搭建基础的SAN存储网络。使用半年后,根据分步实施、不断改进的原则,结合北京大学的实际需求,在二期项目中着重解决了大量资源数据的存储、异地数据灾备、存储网络的延伸和优化、创新性的SAN网络应用构架,最终搭建了北京大学信息与网络数据中心的完整框架。

    二期项目中最复杂最关键的建设就是整个数据容灾系统的建设,目前主流的灾备技术主要有硬件级复制技术和软件级复制技术(区别如表所示);链路的选择有纯光纤技术和以太网络的数据传输;链路设备也有FC交换机对FC交换机,路由器对路由器,以及通过DWDN等增强光纤通讯距离进行通信的特殊设备。    

    选择硬件级灾备系统

    在2001年“9·11”事件发生前,灾难恢复还没有引起足够的重视,但“9·11”后原世贸中心内营业的各公司处境和出路却发人深省,有的公司实施了很好的灾备措施和管理规范,损失巨大但很快恢复了其业务;有些公司实施了基础的灾备措施,但没有进行灾备演练和妥善的文档资料管理,公司损失了许多时间,影响了公司业务和形象;还有很多干脆没有做灾备保护措施,其结局只能是消亡。当然,“9·11”给世人影响最深的还是那些能够迅速恢复业务的公司,其快速恢复能力不仅增强了用户对其的信任,更增加了公司的生存能力。“9·11”也再次让大家认识到数据在信息时代的重要性,没有数据,其生存都无法得到保障。

    基于对“9·11”事件的认识,我们认为灾备保护应涵盖两个方面的内容,即硬环境建设和软环境建设。硬环境指必要的数据保存和恢复设施,如智能阵列、带库、及相关链路条件等;软环境指对专业技术人员的保护和相关文档资料的整理及妥善保存。两者缺一不可,硬环境是基础,软环境是操作手段,没有硬环境的灾备无从做起,没有软环境的灾备难以恢复,原有的大量投资将付之东流。

    在综合考虑北京大学自身情况后,北京大学的灾备项目最终以硬环境投资为主,兼顾加强完善文档资料的整理及保存,努力使项目建成后能够最大限度发挥其成效。

 

目前主流的灾备技术主要有硬件级灾备技术(阵列级)和软件级灾备技术(主机级),两方案各有特点和长处。

    硬件级灾备技术更关注性能和综合能力,其与主机平台的无关性可以保障各种主机系统同时实施,而且对主机的性能影响最小;软件级灾备技术的优势体现在灵活和投入上,对简单的主机系统(数量很少)比较方便,通过主机上的特殊文件系统,依赖网络环境可进行超远距离的数据灾备。

    基于以上两种技术的特点分析,结合北京大学的情况:现成的长程光纤,合理的灾备地点昌平,以及北京大学复杂的应用情况多平台(Solaris、Windows、Linux)、多主机(SUN、Fujitsu、DELL多达近20台)、多版本的具体因素,在慎重考虑综合成本之后,北京大学决定建设硬件(阵列)级灾备系统。北京大学在2004年进行了该项目一期建设。通过国际招标,最终选定了富士通提供的Eternus3000的M600盘阵组成裸容量20TB的业务存储节点,使用富士通提供的Eternus3000的LT160A2带库和LegatoNetworker备份软件组成一套完善的备份系统,Mcdata公司的两台4500构建成冗余的光纤网络环境。

    系统在2004年11月进入调试运行,12月业务正式上线,总计有15台服务器和20多个业务系统使用了盘阵,20多台主机享受备份系统的保护,从而搭建了北京大学数据中心的安全、高效的存储备份环境。

    一期项目正式运行半年后,北京大学又结合新需求和新应用,如图书馆和现代教育技术中心大量资源数据的存放,大量关键应用数据需要得到更完善的保护,北京大学决定对系统进行升级,采购了两台富士通的Eternus3000的M300,一台15TB的作资源存储,另一台5TB放置在昌平作灾备节点存储。其链路设备的选择在充分调研和测试后,最终选择了Brocade7420路由器作校园内SAN主路由,创造性地利用SAN路由器的特点,既能够实现数据灾备链路,又能够通过SAN路由和SAN交换机搭建北京大学的第二网络—FCSAN光纤数据网络,使得未来北京大学的数据存储可以延伸到光纤能到达的每个角落。

    在经过长达近两年的项目建设之后,北京大学数据中心规划目标全部实现完毕,解决了许多信息化过程中棘手的难题:

    第一,通过数据中心的集中式存储解决了目前数据的物理存放的安全和效率及容量问题;

    第二,带库和备份软件的使用大大降低了系统管理人员的工作压力,备份工作不再繁琐和复杂;

    第三,基于路由设计的光纤网络极大地提高了北京大学存储网络的弹性和扩展性,其方案设计不仅解决了SAN交换的扩建问题,还有效解决了远程灾备链路的连接问题,使得该网络满足了高效、安全可靠、简单实用的多样化需求,也满足了未来较长一段时间内的需要;

    第四,分区分类存放数据,不仅解决了系统的压力和投资问题,还大大提高了整体的使用效率和安全性。

    灾备系统的建立,为北京大学信息化建设提供了高可靠高冗余度的数据保护环境,降低了极端环境下发生问题的损失,提高了北京大学信息化系统的安全性和可恢复性,整理了一套完整的灾备恢复资料,为未来的不可预见的问题奠定了良好的软环境,提高了北京大学灾备系统的可用性。