微软的Windows Azure存储云的安全SSL存储发生全球性故障,根源可能是HTTPS证书过期。
这次故障最早是太平洋时间周五12:44pm由微软在Windows Azure Service Dashboard上公布的,1:30pm更新的信息显示SSL交易出了问题。
根据MSDN论坛上的一个帖子称,似乎微软犯了一个根本性错误,使得Azure Storage的HTTPS证书过期。这次故障可能会影响到blob和表存储。
微软论坛用户对此次故障表现十分愤怒。网友MJFara写道:“这是不能接受的,我还敢在这个平台上发布企业应用吗?”
在此之前,亚洲和美国地区也反复出现一些故障,随之而来的是SQL Reporting为期一周的停运。
在全球范围内的每个数据中心发生核心服务故障,这对于一家云提供商来说是非常糟糕的事情。
根据当天3:00pm的消息,Azure正在遭遇全球性的级联故障。这些存储故障已经严重影响到Azure云的其他关键组成部分,甚至包括一些微软认为是与劲敌Amazon Web Services区分化的服务:
Windows Azure Service Bus,帮助在“Megacloud”的各部分之间传递数据;Azure Web Sites,提供简单的托管功能;Access Control 2.0;windowsazure.com站点本身也受到了“服务降级”的影响。
另外计算也受到故障的影响,虚拟机部署有问题,但核心计算仍然是可用的。
在Twitter上有传闻称,Xbox Live的某些功能也出现故障了。
微软正在极力解决这些问题。“目前我们正在测试环境中验证修复步骤。”,太平洋时间2:15pm。
太平洋时间5:52pm,微软开始了在“某些”受影响存储集群上的恢复。
微软表示,这可能需要数小时的时间,它“正在验证更快速的恢复选项”。
微软承诺将在两个小时内做进一步更新,但考虑到这次故障涉及范围之大,恐怕微软要彻夜忙碌了。