互联网如何保证安全和可靠?著名的Twitter网站2009年遭遇的断电事件令微博客社区震惊不已,也让许多业界观察家重新思考网络通讯的可靠性和大家想当然的交易能力的问题。
根据Nielsen NetRatings的市场调研数据显示,Twitter网站的用户群从2008年2月到2009年1月暴涨了几乎1400%,网络拍卖和电子邮件对一些用户来说是方便快捷的网络工具,但是还有一些用户将这些网络功能视为他们日常生活和与外界联系的中心。可是如果我们如此依赖的网络在我们需要它的时候崩溃了呢?
Twitter网站今年8月发生的断电事故令许多长期从事互联网研究的观察家们深感意外–在很长的一段时间里他们都在重复着这次故障–此次事件所引发的震动以前所未有的速度和规模蔓延到了整个世界。由于无法登录Tweet,用户们转向博客,网络论坛和其他渠道来发泄他们的愤懑。网络和电视媒体到处都充斥着来自新闻工作者,学者和Twitter用户的各种评述和大讨论。
当断电事故的起因被归结为带有政治企图的分布式拒绝服务攻击时,各种传闻更是甚嚣尘上。当尘埃落定,Tweets又重新启用时,一个很大的疑问依然存在:这种事情还会再次发生吗?回顾类似规模的其他网络服务断电事故和究其起因可能对回答这个问题会有所帮助。
必备的专业精神
2006年7月,MySpace社交网站在被互联网市场跟踪调研公司Hitwise评比为美国顶级互联网资产的仅仅两周后,就陷入瘫痪超过11个销售之久。根据记录Myspace.com网站在过去的两年中访问量增长达到了令人震惊的4300%,速度之快甚至超过了搜索巨头谷歌公司。2005年,News Corp.(纳斯达克代码:NWS)斥资5800亿美元收购了MySpace和他们私有的主页服务。
毫无疑问,MySpace是热门的互联网资产,但是在2006年夏天,加利福尼亚州南部的气候更加炎热。屡破记录的高温和频发的供电管制席卷着MySpace服务器总部的所在地-洛杉矶。一次断电冲击了MySpace的数据中心,备份发电机也出现了故障,导致超过6500万用户陷入一片黑暗。
5亿的互联网资产是如何轻而易举的化为乌有?平时使用备份电源系统是为了确保他们在需要的时候能解一时只需。在一座大型的服务器农场中运行能源测试是需要很大的专业精神和勇气的。
MySpace的首席技术官Aber Whitcomb在断电事故发生前的一个月还在微软大会上详细介绍过MySpace基础架构。Myspace.com大概运行着2700台网络服务器和650台数据库服务器来处理访客流量。
定期关闭商用供电来确保不间断电源,高速接电设备和柴油发电机所有的功能运转正常是保证在实际发生断电事故时供电正常的唯一方法。对于托管在位于不同地理区域的数据中心内的关键网络服务并确保所有的鸡蛋都从一个篮子里分散出去也是非常重要的。