公有云浪费超过100亿美金!你浪费了多少?

RightScale评估了企业云资源浪费情况,并发现平均35%的云费用支出被浪费了。仅仅国外的三大公有云提供商(AWS,Microsoft Azure和Google Cloud Platform)浪费的云支出就超过100亿美元。

Gartner研究显示:平均来说企业上云会节省14%的成本,但是到2020年,由于缺乏成本优化手段,80%企业的云资源成本将会大幅超出预算;同时,45%的企业由于缺乏优化措施,在直接迁移上云的过程中会超买55%的资源,并且在上云的第一个18个月内会多花费70%。

那么,是那些原因造成这一巨大的云浪费?

造成巨大云浪费的原因?

使用云过程中可能造成浪费的因素

使用云过程中造成的浪费主要是资源的不恰当使用:

 超过应用需求配置的实例,比如4CPU8G内存的实例就能满足需求,但是却申请使用的是8CPU16G内存的实例,造成几乎一倍的费用支出;

 不再使用的资源不及时释放,包括各种云上的收费的资源,这往往是因为遗忘造成的。比如申请了弹性IP,因为相关的业务不再使用,退还了云主机实例,却忘了归还弹性IP,造成弹性IP一直计费;

 不合理的快照使用,对不应该使用快照的云主机也配置快照,对快照的数量使用过度,另外,也可以引入一些自动化运维的方案,来替代快照方案,以节省成本;

 不合理的带宽费用,带宽费用是云使用中很大的一块。应该对业务带宽利用合理规划,不同的需求进行错峰,比如,备份流量就应该和业务高峰期错开。另外,压缩率比较高的文件,应在传输过程中进行压缩在传输。用户访问频率比较高的资源,可以考虑使用CDN,因为CDN带宽往往成本更低。

组织内部不完善的管控造成浪费

组织内部不完善的管控和技术能力不足,也会造成云浪费:

 云资源申请没有内部流程管控,或者控制不严格,造成超过需求配置、超过使用时间的云资源使用;

 云资源使用管理混乱,没有监控,或者监控追踪不够细致,造成云资源利用率不高,或者过期云自己不能及时释放;

 没有费用预警机制,当因为某种漏洞或者突发情况造成费用支出突然增加的时候,没有预警机制,比如误操作造成带宽疯狂增加,这时候就需要及时预警;

 没有充分利用自动化工具,及时根据业务压力情况调整云资源配置,从而节省云费用;

 对节约云费用的培训不够,奖惩不明确,造成部分组织成员没有节省云费用的意识;

 在组织架构上没有统一的云治理部门,造成云资源使用混乱,失去和云供应商的议价能力,失去应有的优惠折扣。也不能推行内部使用云的标准化,造成云资源使用方式停留在比较低的水平,甚至基本的安全问题都不能保证。

企业在云上的浪费,消耗的都是真金白云来之不易的利润,是应该极力避免的,那么,如何优化云成本,尽量避免浪费?应该从两个方面入手,一方面建立组织统一的云治理中心,一方面引入相关的工具。

组织应建立统一的云治理中心

随着云使用量的增加,很有必要在组织内部建立统一的云治理中心,即便这个中心只有一个人,或者与其他工作共用一个人,以便在以下方面对云的使用持续优化:

 内部流程,流程应该在优化成本和方便性之间取得平衡,否则企业上云获得的敏捷性将会打折扣。

 建立标准,提升自动化水平,利用云的API,在业务层面实现自由弹性的伸缩,当业务压力增加时,增加云资源,反之则释放云资源,是对云敏捷性利用的更高阶段,也是云成本优化的更高阶段。

 安全保证,安全必须从全局出发,统一的云治理中心是对云安全的有力保障。

 内部培训,持续优化,云成本优化是一个持续的过程,也需要不断的提升内部员工的意向和能力,需要专门的分支部门持续推进。

 推进新技术使用,云原生、无服务器计算等新技术的使用,可以提升云使用的水平,同时也节省云成本,但是如何推广和使用,需要有专门的分支部门组织和推进。

使用工具优化云成本

云成功优化工具方面可以分为开源工具、云厂商工具和专业工具。

开源云优化工具

开源工具主要是自动化类的,比如Puppet、Ansible、SaltStack等,还要监控类的,比如Zabbix、Nagios、Prometheus、Grafana等。自动化类可以提升云部署效率,监控类的工具可以收集分析云资源使用情况。

云厂商云优化工具

AWS成本管理器

AWS成本管理器可以提供报告、分析和可视化功能,可用于跟踪和管理 AWS 成本。:

 查看 AWS 成本和使用量的整体状态,查看支出状态、找出在整体支出中占比例最高的服务,并总体了解成本的变化趋势。可以使用其他多种成本管理工具来深入分析AWS 成本和使用量。

 AWS 成本管理器可以帮助显示、了解和管理AWS成本和使用量随着时间的变化。可以在一个直观的界面中快速创建各种自定义报告 (包括图表和表格数据),从而在总体角度或针对特别具体的请求分析成本和使用量数据。

 设置自定义成本和使用预算,借助 AWS 预算,可以设置自定义成本和使用预算,使其在超过阈值时提醒。

2 微软Azure

微软2017年收购了以色列云监测和分析初创公司Cloudyn。Cloudyn公司创立于2012年,它致力于帮助企业客户通过分析和优化工具来自动监测器云服务成本。可见微软对云成本优化的重视,Azure云成本工具可以从维度自动导出计费数据和计划的报表。

其他云厂商一般也都提供云成本优化工具或者方案。

开源的工具,只能解决云成本优化的部分问题,并且使用门槛比较高,云厂商的工具只能针对自家的云使用,不支持多云情况,也不支持对用户内部流程和业务优化,如果要寻求整体的云成本优化方案,还是要借助Cloud MSP(关于Cloud MSP能做什么,请参考云时代,Cloud MSP时代! )。

Cloud MSP可以帮助建立优化组织内部的云治理部门,也会提供支持多云的云成本优化工具,比如ChinaMSP总结出了一套“公有云费用优化最佳实践”,也用于专业的云成本优化工具CostVison,帮您找到云费用最优解。

ChinaMSP云成本优化方案解析

ChinaMSP总结出了一套“公有云费用优化最佳实践”,此最佳实践共分为9个步骤:

根据ChinaMSP的实践经验,公有云费用优化最佳实践实际上是一个最好按序抵进的行进路径:

此处增加“脑图中云费用优化最佳实践”的内容描述,重点描述RI管理的部分。

China MSP的云成本优化工具CostVison,针对用户云成本痛点,提供以下功能:

1.管理支撑:

费用分析:服务类别(云主机、存储、网络传输、数据库等服务)费用占比;资源使用分析:云主机、数据库、云存储的资源利用率分析,是否存在优化空间;费用分摊:各个部门和小组的费用支出分摊;预算匹配:预算是否超花。

2 优化建议:

云主机配置,RDS配置,未使用弹性IP检查,未挂载云磁盘检查,预留实例购买建议。

3 自动化编排:

自动执行周期性操作:如工作日早九点到晚八点,对标签为”研发“ 的资源执行批量自动启停资源规格自动调整:如根据业务负载基线,在资源使用率低的时候降配、在负载提升前升配负载均衡组自动扩缩策略:根据业务负载自动在闲时降低资源组实例数量自动发现竞价实例:根据业务情况进行竞价实例购买、部署和使用自动调整预留实例价格:根据基线及时调整使用率不高的资源,最大化利用预留自动备份与删除快照:自动创建实例快照、删除冗余快照,确保最小数量快照和镜像,节省存储费用

总结

云上每节约的一分钱,都是节省的利润,随着使用云的规模增加,企业非常值得下大力气专门对云成本进行优化。云成本的优化是一个长期的过程,需要专门的部门推进,也需要专业的云管理服务商和工具支持。(文/云技术实践 君子兰)