台风背后的云计算

每年夏季,源自南太平洋的台风便频频造访浙江。这一危害极大的气象让所有的东部沿海居民受到威胁,也让浙江省台风路径实时发布系统压力倍增,平日只有几万PV的网站会在几天之内上升到几百万PV。很少有系统会比灾害预报系统受到的压力更大的了,在这类突然剧增的访问量面前,甚至连淘宝网的双十二大促销这样的大型网络狂欢都相形见绌。毫无疑问,浙江省台风路径实时发布系统就遇到了这个难题,而解决这一难题的方式则是与阿里云合作,采用了先进的“云计算”。

台风路径发布系统

从每年的5月开始到11月间,东亚就进入了台风季。太平洋上可能会诞生数十个热带气旋,其中有很大部分最终并未发展成为台风,还有些则因副热带气压带而滞留海上,能够登陆的台风数量并不多。

但凡是登陆的台风就如同精挑细选的死士一样异常可怕。在来临之前,政府发布公告提醒做好准备,严重的时候则会发布放假通知,所有企事业停工,学校停课。上上下下关注台风的方向和威力,由于其强大的威力,在信息传播尚不发达的时候甚至酿成不少谣言。

在互联网时代,上网去看台风成为公众了解信息的主流途径。这当中,实时更新的台风路径发布系统成为最重要的信息源。电视台和微博上的信息绝大多数来源于这个网站,因为防台指挥中心的大屏显示的就是该系统。

浙江的这一系统还汇聚了中港台日美5地气象部门的预测数据,并以每小时更新一次的速度快速跟进台风进展与路径。是抗台防灾指挥、市民生活出行的重要依据之一,其对于稳定性的要求异常严苛。

一位横向对比了台风预报网站的工程师表示,目前在技术投入上相对重视的主要有浙江省台、温州台、上海台,其他省市的台风预报系统非常简陋,甚至保持了官方机构一贯对于非IE浏览器的极端排斥。

无疑,这与浙江省对台风之痛刻骨铭心有关。1956年,三门县登陆的台风造成近5000居民死亡。1988年8月8日杭州因台风全城停电5天。1997年台风受灾人口2167万,占全省人口的一半。近年来每个超强台风均会带来180亿以上的损失。

巨大的流量挑战

“宕机是最常见的情形。”今年台风季中,每遇台风来临,就会有一些气象网站陷入崩溃,原本采用的技术就并不高超,遭遇到如台风版上网找资料的用户之后,简直就是“弱爆了”。

以8月8日登陆过境的超强台风海葵为例,8月5日的系统访问量仅有区区不到10万,而6日增加到80万,7日增加到250万,8日创下350万的访问,这也是该系统自上线以来的历史新记录。也就是说3天内的访问量增长了几十倍。

“按照400万访问的标准去配置服务器是不太现实的,因为除了这一天之外,99%的资源就会闲置浪费。而临时去找满足新增99%的计算资源也是非常有难度的,因为采购与部署需要大量时间。”该系统负责人表示。

“这是非常典型的云计算弹性应用场景,我们很快达成了合作意向,并且快速去做,以7月份的第一个台风为测试对象,结果完全无压力。”阿里云计算总监张敬表示,当前只有云计算可以实现这种规模的弹性。

为了应对更大规模的台风海葵,一共动用了SLB负载均衡、云服务器、开放存储这3种产品。负载均衡负责将暴增的用户动态地引导到不同的服务器上,以防止单个服务器压力过大而崩溃。而数台云服务器则被部署到不同的集群上,这使得即便单个集群出现意外也不至于系统崩溃。开放存储中存放了历年的台风数据,并且得到气象站不断更新的数据上传,这些数据都被同步存储到不同地方的存储设备上,确保不会因为硬盘故障而丢失任何数据。

一言以蔽之,分布式的云计算将风险尽可能地降到最低点,而与此同时也能根据访问的量进行动态的扩展。这是一个在前几年还仅仅是设想的大型系统飞天所提供的部分服务,也是阿里云计算的核心服务。

云计算如何被落地?

台风必然带来灾害,所幸的是,海葵并未造成太大的损失。在总结经验的过程中,云计算第一次与预警、应急等一起被列入防台成功经验。这也意味着,云计算这种由互联网技术发展而来的通用技术成为现实的生产力。

作为管理部门的浙江省水利厅,还希望借助云计算进一步增强台风路径发布系统的功能,将水文资料、实时图片等集成进去,做出全国最好的台风系统。

事实上,作为新生事物尤其是企业提供的服务,往往很难得到政府部门的积极接纳。云计算也面临这一困境。但在防台过程中体现的价值也深深地吸引了许多单位的关注,这些公众服务实际上都具备非常典型的峰谷效应,迫切需要弹性的廉价的云计算的支持。

“云计算的推广过程与研发一样艰难,但事实证明云计算是被很多人所需要的,未来会更好。”张敬表示。