云风暴来临 用户如何摸着石头过河

服务器在线8月21日报道 继亚马逊的S3云存储服务由于软件错误遭遇折戟沉沙数周后,又有两种在线服务遇到问题。由于软件故障,本周一Gmail连续数小时无法使用,在线存储服务 The Linkup也在丢失近一半的存储数据后被迫于上周五关闭服务。对于用户来说,这些服务是用户可以随处访问的资源,其可靠性,可扩展性和经济实用的优势也是显而易见的。但最近云服务所面临的困扰却暴露了在线服务的风险所在。当在线服务遇到问题我们该如何处理呢?

The Linkup的故障是三种在线服务中最严重的。尽管The Linkup目前仅有2万家付费用户,规模可能是最小的,但其影响却是最大的;因为The Linkup遭遇的不是暂时性的软件故障,而是永久性的数据丢失。The Linkup就是我们之前所熟知的MediaMax,是一种可以提供在线存储和文件,图片,视频和备份共享的服务,免费存储的最大容量可达到25GB。

企业重组导致存储数据丢失

由于一些复杂的企业内部因素,目前导致The Linkup故障的确切原因尚不清楚。MediaMax是源自一家名为Streamload的在线存储公司的产品。2007年Streamload被拆分为两家公司,即消费类市场定位的MediaMax和商用级别的Nirvanix。MediaMax的数据存储在Nirvanix的服务器上,但是服务却无法使用Nirvanix自己的在线存储产品。于是MediaMax开始将它的数据向Nirvanix新的存储服务上迁移,但是这次数据迁移没有成功,只有 45%的数据完成迁移,剩余的数据仍然保留在原来的系统中。

2008年7月9号TLU公司的主页上发布了一项声明表示此次数据迁移没有获得满意的效果,所有的用户数据和信息将于8月8日删除,用户有一个月的时间来下载他们的文件并另存他处。接下来服务的损失继续恶化,继此项声明两天后TLU公司又表示只有已经完成迁移的文件才能实现下载;仍然保留在原有系统中的 55%的数据已经无法访问。对于这一部分,Nirvanix公司表示原有系统中的文件仍然存在,但是由于Nirvanix目前没有TLU的前端应用程序或数据库,因此他们无法提供数据的访问权。

尽管每个人都知道数据备份的重要性,但事实上多数人都没有做好这方面的准备。在很多情况下数据备份费时费力,因此通常人们都不愿去做。对数据进行本地备份是项单调乏味的工作;如果数据存储在远程云服务上,做本地备份就更加困难。要实施数据本地备份需要合适的工具,比如Time Machine, NTBackup,Vista操作系统的嵌入式备份工具等,但是这些工具都无法满足云存储备份。TLU的数据丢失说明,数据备份对于在线存储比本地存储还要迫切。即使数据是完整的,要想访问这些保留在托管公司的数据,还需经过他们的授权。

对云进行本地备份

使用TLU这样的在线服务的优势在于多数存储的数据可能是本地文件的副本,因此从某种意义上说已经是数据备份了。不像S3,MobileMe和Gmail 那样真实。许多网络电子邮件的用户上网只是为了访问邮箱,因此他们进行数据备份的能力是有限的。同样,诸如SmugMug就是使用S3来进行大量的数据存储,除此之外没有其他的数据来源。如果这些服务中断或者无法使用,那么直接导致的后果就是用户根本无法访问上面存储的数据。

用户有时会一厢情愿的认为亚马逊或谷歌的服务不会出现TLU这样的状况,他们对网络服务存在的风险没有足够的认识。用户依赖Gmail和S3,在 MobileMe稳定后他们还会将信任继续下去。用户对这些服务的依赖说明这些服务是实用而且重要的,但是在线服务的风险也凸显出整个系统的脆弱。

对于Gmail这样的在线服务,一些解决方案是可行的。有效的做法就是彻底远离Gmail的网络界面,依靠传统的本地电子邮件服务(诸如 Thunderbird或者Outlook)来取而代之。Gmail支持常规的IMAP和POP访问,因此非常适用于标准的用户需求。单机版用户能进行脱机操作,比如脱机查阅,编写,删除和搜索电子邮件等,还能提供所有在线存储信息的简易备份。IMAP协议特别适用于这种模式的操作;脱机操作也是他们的设计准则之一。还有一个选择就是使用电子邮件客户机或专门的程序来对收件箱进行定期本地备份,但这种做法仍然需要使用Gmail来进行常规邮件收发。

网络服务的本地执行

或许最适合云服务精神的解决方案就是谷歌自己的Gears系统。Google Gears是一款允许网络应用软件客户端部分和应用软件运行的数据实现本地存储和运行的应用软件。用户使用Google Gears可以在脱机和联机两种状态下运行同样的应用软件,用户无需将本地界面和网络访问分离就能使用本地应用软件。但不幸的是,尽管谷歌将Gears应用于他们的Reader和Docs应用软件,但它并不适用于Gmail。

微软公司最近对未来的云平台产品规划直指与谷歌类似的性能。微软表示他们的云平台将允许应用软件在本地系统和云数据中心上都可以运行,但主要针对已经成熟的应用软件,而不是AJAX应用软件。

将几种方法结合使用是有效的,否则他们无法解决所有的云可靠性问题。TLU的在线分配和共享特性在本地备份中无法实现;同样,如果S3出现故障,SmugMug的站点就无法访问多数数据。

结果就是SmugMug只能接受亚马逊随时可能出现问题而导致数据无法访问。用户需要更多的可靠性和企业级的保障。S3一个8小时强度的宕机就意味着亚马逊可能会丧失本年度对高可用性的保证(每年宕机时间8小时45分钟,99.9%的高可用性,5分钟宕机是高可用性的金牌标准)。

总之不管采用什么方法提高可靠性,有件事情是非常清晰的–那就是云短期内不会取代传统的应用软件。