迁移至云计算环境中 APP的可靠性问题

越来越多的企业计划将他们的应用程序迁移到云计算的环境中。由Stratus、北桥创投合伙人和GigaOM联合展开的一项调查结果显示,75%的企业都使用了某一模式的云平台,截至2013年,全球云计算市场的1588亿,相较于2011年增长了126%。

随着云计算落地的热情高涨,安全问题也随之而来,但从今年的云计算落地来看,企业接受云计算的步伐明显加快,安全问题不再是企业走入云中的首要障碍了,企业开始希望云计算服务提供商能够在新环境中关键商用应用程序的基础设施的支持。

【App 在云中】

企业需要非常认真的审视那些应用程序是否可以放入云计算的环境中运行,然后还要考虑这样带来的资源、技能、成本和复杂性管理上的转变。当然,没有一个好的方案可以适合所有的企业,毕竟每个企业的情况都不一样。但很多情况下,重写应用程序也并不能完全解决问题,那么要如何评估应用程序迁移至云计算环境中的条件呢?

关键性应用的可靠性问题

企业将应用程序迁移到云计算环境中的价值主张非常明确:提高应用程序的扩展性和灵活性。但在很多情况下,云计算基础设施直接关系着关键性应用程序的运行,所以可靠性仍然是IT人员的心头大患。

【云计算的可靠性问题】

企业是奔着云计算的规模和弹性去的。企业要明白独立的云计算组件失败的概率非常大,除非你的应用程序是设计来解决这些工作负载带来的架构故障问题,否则你这样做将会遇到严重的问题。

基本上,很多企业会将一些基本的应用程序迁移到云计算环境中,也会在云计算环境中开发一些新的应用程序,但很少看到企业将首层的应用程序进行迁移。

任务关键型应用程序的崩溃问题

关键型应用程序的宕机无疑会造成业务的瘫痪。去年感恩节前夕,美国联合航空控制地面业务的系统发生了全国性的宕机,造成了两个小时的业务瘫痪,从而导致众多乘客航班的延误并错误其他国家的飞机。另外,圣诞节前夕,亚马逊AWS云服务的宕机,导致Netflix数百万的用户无法观看电视节目和电影。

【云计算的宕机问题】

根据Aberdeen 集团的调查数据来看,宕机造成的故障造成每小时138888美元的损失。

50%的IT决策者希望每年的宕机时间不超过30分钟,事实上他们还没有真正走入云端,目前他们能获得两个9的可靠性保证,但他们想要的是四个9或5个9的可靠性保证。(两个9可靠性是指云服务提供商提供99.99%的可靠性)

所以到最后,一些特定的应用程序可能根本不会被迁移到云计算环境中,因为成本和风险无法承担。这些应用程序会被留在裸机或是虚拟化的环境中,但不会走入云计算环境中。这些应用程序可能因为性能和功能的原因被要求在专用的硬件上进行运行。

所以,企业要评估每个应用程序以确定应用适合在哪个环境下运行,包括虚拟化环境、私有云荒井或者是混合云环境。任何情况下企业都要都要权衡风险和收益。

可靠性三个重要的因素

在考虑是否将应用程序迁移到云计算环境中,第一个要评估的要素就是宕机带来的成本问题。

无论你是在寻找一个基于云计算的机会还是本地安装的模式,企业都要知道应用程序崩溃所带来的成本损失,因为宕机带来的损失不仅仅是金钱的损失,还将带来企业信誉的损失,品牌影响力的损害,对于公共安全的应用程序,很有可能还会是以生命为代价的成本损失。成本损失的评估将会让企业更好地理解应用程序的可靠性等级以及如何更好地部署应用程序。

如果企业决定跟着云服务提供商的路线走,那么也要做好云服务商无法保证服务水平协议的时候的紧急备用计划,因为有了亚马逊的前车之鉴。

一些SLA会这样写到:我们保证100%的正常运行时间,但你要是认真查看合同的细节,你会发现它还写着这样的一句话:如果我们无法保证,那么在下个月的账单中会减去20%的费用。但是一个典型的第1层应用程序崩溃一个小时将会造成15万美元的损失,你云服务商的20块钱能弥补么?显然,这个解决方案需要更高的可靠性协议。

此外,企业还要考虑数据保护的问题。除了在数据交易层保证数据的安全,企业还要考虑其他宕机发生的可能,如地震导致的数据中心的毁灭性倒塌,企业的备份工作是否考虑到了。