企业平均浪费32%的云业务支出。随后,在2023年的报告中,FinOps 12年来首次超越安全,成为诸多企业关注的头等大事。
1、设置指标洞察成本异常
-
Uptime:系统为用户请求提供服务的时间
- CPU 利用率:用于完成特定任务或处理用户请求的所需算力的百分比
- 内存使用:公有云、私有云及混合云环境中内存的使用情况
- 每分钟的请求数量:基于云的应用每分钟收到的用户请求的数量
- 磁盘使用率:跟踪某个节点上使用的磁盘容量,并确定存储容量是否能够满足工作负载
- 平均确认时间:系统响应用户请求所需要的时间
- 延迟:请求时间到响应时间的间隔
- 平均故障间隔时间(MTBF):系统或应用程序发生故障之间的平均间隔时间
-
平均修复时间(MTTR):在发生故障后系统恢复服务所需时间。MTTR 越短意味着宕机成本越小,有助于云成本优化
2、借助热力图了解系统内部正在发生什么
3、选择预留实例或spot instance
-
预留实例:企业如果预先承诺在1到3年内使用一定量的资源,那么可以通过预留实例来节省云资源。根据平台和其他变量的不同,相比于按需资源,预留实例可以节省高达80%的费用。主流的云厂商都会提供该定价模式。预留实例适合具有稳定、可预测容量的工作负载。
-
Spot Instance:开发人员可以以大幅折扣的低价获得未使用的容量。是否能够凭借这一定价模式节省费用主要取决于所购买的资源类型以及购买时的价格。Spot Instance 的缺陷是它们可能会被突然切断,这主要由地区的整体容量需求确定。因此,此类实例最好用于无状态工作负载、批处理作业和其他可以允许中断的任务。
4、合理调整计算服务
行之有效的调整可以节省高达70%的云成本。
5、SDLC 的每个阶段都进行成本优化
-
Plan:使用数据证明预算的合理性,并通过成本数据为技术债务相关决策和产品路线图提供信息。这种做法有助于减少突发性的额外支出,并且可以根据需要灵活且迅速地调整预算。
- 部署和操作:迅速发现意外指出,并调整成本和预算
- 设计和搭建:记录所有必要的数据,以便在最佳资源使用的基础上为架构决策提供信息。
-
Review:按团队、功能和产品重新评估成本,以根据业务举措报告业务支出和投资回报率(ROI)
6、避免云蔓延(Cloud Sprawl)
7、采用云原生设计
8、消除影子IT(Shadow IT)
总结
云成本优化并不是偷工减料和减少开支,而是采用一种策略性的方法来创造价值并且提升业务表现。借助正确的工具和方法,企业可以节省大量的成本、优化资源利用率并且交付更好的客户体验。所以,无论是初创企业还是大型集团,将云成本优化作为重中之重,将会看到业务在云计算的助力下展翅腾飞。