紫田 蓝芒事件引发思考策略:未雨绸缪永不宕机

      事件回顾
  
      2007年8月28日汕头电信机房接上级单位通知,因厦门蓝芒科技,查出严重的违规信息,公安部通报并责令汕头机房中断了约800台服务器的网络连接,具体原因至今不明。据蓝芒客服解释:汕头电信机房部分服务器出现了大量BBS站点及违规贴,之前已经停掉约40台服务器, 8月28日17时突然通知强行断掉汕头电信所有机房的服务器的网络连接。

      厦门蓝芒科技创立于1997年,为全球企业、组织机构及个人用户提供互联网服务,是国际知名的互联网应用服务的提供商(ASP)及互联网服务提供商(ISP),主要的业务包括主机托管、主机租用、网站开发等。经过10年的发展,蓝芒科技已经成为国内IDC行业的领头企业,拥有庞大的用户群。此次出现事故的汕头电信机房就是蓝芒科技最重要的IDC机房之一。蓝芒科技停止近800台服务器的正常网络连接,可以说是为了配合公安部严打网络淫秽色情专项行动,是无奈下的举动,但大量的最终用户却成了直接的受害者,网站不能继续提供服务,为企业带来无可估计的损失。
  
      未雨绸缪,永不宕机
  
      大量企、事业、个人托管租用电信机房的设备、带宽等,是因为电信机房的网络服务环境是最有保证的,而此次确要为网站服务终止烦恼。“星盈科技”历经7年针对于数据安全行业研发出一套简易实用的“Goback”解决方案,构建数据灾难备份/恢复系统。

      星盈科技一直专注于服务器、存储行业,经过多年的市场分析,星盈科技发现随着计算机科技的发展,越来越多企业实现业务、数据、应用的信息化后,数据的安全、业务的连续性就成了企业管理者必须认真思考的一个问题。客户资料因通信线路故障而中断;机房事故导致公司业务无法继续,这些大大小小、似乎是防不胜防的灾难事件给我们的正常生活和工作带来了许多负面的影响,比如经济损失、信誉受损,甚至可能导致企业倒闭。据IDC的调查数据显示,2000年以前的10年中,美国发生过数据灾难的公司中,55%当时倒闭,29%在两年内倒闭,生存下来的仅占16%。因此,星盈科技认为,为了避免或者尽量减轻这些事故或者灾难对业务的影响,企业必须建设完善的数据备份及灾难恢复系统,可以在灾难发生后,尽快恢复数据,保证业务不中断,将损失降到最低,为此,星盈科技推出了基于业务连续性的Goback灾难备份/恢复系统。

      星盈Goback系统是一套完整先进的灾难备份/恢复解决方案,针对当今企业要求的7×24小时永久联机的IT环境而设计,完成以下几个重要目标:

      可覆盖所有潜在的灾难,包括Sudden Disaster(意外灾难)和Rolling Disaster(软性灾难 如人工错误)
      保护用户的全部数据网络
      在灾难的每个阶段(灾难前、中、后)提供有效的数据保护
  
      实现原理

      阶段一:灾难之前
   




      如果在主站点配备一套星盈Goback灾备系统,在灾备站点也配备一套星盈Goback灾备系统,同时还需要配备虚拟服务器系统和存储系统,当灾难发生故障时,星盈Goback灾备系统就能利用备份的数据和虚拟服务器将主站点的应用切换过来。

      主站点的Goback系统能够将磁盘分区映射给应用服务器,与应用服务器本地磁盘形成RAID 1(镜像)模式,使得数据互为冗余。主站点的Goback系统通过Replication模块,以i-SCSI或FC协议将冗余的数据备份到异地灾备站点上,实现数据的异地容灾。

      灾备站点的应用系统可通过虚拟服务器虚拟产生或由多台服务器提供OS及应用服务,软件环境配置与主站点完全相同。

      快速的初始同步

     
如果遇到主站磁盘数据非常庞大的情况,使用普通线路进行复制,需要花费大量的时间,为了解决这个问题,星盈Goback系统允许通过镜像加载或通过磁带的图像备份/恢复进行大批量数据处理,使得复制数据与原始数据保持同步。针对变化的数据,星盈Goback系统再利用差异扫描的方法创建一个初始的增量图,快速地将小部分的变化数据进行同步。

      阶段二:灾难之中
   




      当灾难发生时,主站点关闭,立刻启动灾备站点的虚拟服务器,将各个应用系统正确启动,再利用Goback系统将备份站点的备份存储系统映射给虚拟服务器,形成完整的备份应用数据系统,维持业务的连续性。

      Sudden Disaster 意外灾难

      如果主站突然发生故障,就有可能中断正在进行的复制程序,为了防止灾难发生时的数据丢失,星盈Goback系统会将变化 保存入单独的区域而不会再将变化写入复制磁盘中,除非整个复制磁盘都被认可和确认。因此,无论复制命令成功与否,都会重新执行复制,局部复制的数据不会被应用到复制磁盘。

      Rolling Disaster 软性灾难

     
当发生类似于人工错误操作导致发生数据丢失的灾难时,星盈Goback系统的复制磁盘就会被提升为主磁盘,由TimeMark创建的单点时间的增量快照可以即时地将数据恢复到灾难发生前的最后状态。星盈Goback系统可对一周的历史数据进行记录,为数据恢复提供了极大的方便。许多带复制功能的存储产品(如Veritas的Volume or File Replicater、NSI的Double-take等)都不具备保留历史复制数据途径的能力,因此,在遇到Rolling Disaster时是极易受到损害的。

      最小化数据损失

     
星盈Goback系统的异步镜像功能也可是复制站点与主站点的数据几乎完全同步,只有极少的交易数据损失。在灾难发生过程中,复制数据可在镜像拷贝完成恢复处理的同时被用于即时的重启(保证业务持续性),镜像还可被用于恢复在复制磁盘中未被发现的额外数据交易。

      快速重启

      星盈Goback系统针对数据库,文件系统和信息存储系统(Oracle、informix、SQL、Sybase、DB2、Microsoft Exchange、Lotus Notes/Domino等)的快照代理功能,使复制磁盘始终处于可用状态,随时可通过操作系统或数据库/信息应用程序被提升为主数据集。快照代理功能帮助确保复制磁盘的数据完整性,在重启应用系统前,就无须进行耗费时间的磁盘检查等处理。

      阶段三:灾难之后

     
当灾难解决之后,关闭灾备站点,恢复主站点的应用系统和存储系统,利用Goback系统将进行数据恢复。

      快速的反向同步

     
为了使主站在数据修复后重新工作,必须将更新数据进行反向同步,从灾难恢复站点回传到主站点。星盈Goback系统快捷的反存和差异扫描功能极大的缩减了重建主站时间。