文档

成本优化

更新时间:

成本优化支柱提供了云上成本管理及优化的设计原则和最佳实践,帮助企业高效地使用云服务来构建业务应用,减少不必要的开支并提升运营效率,让企业在云上更具经济效益。

设计原则

在成本优化过程中需要遵循一些重要的优化原则,这些原则能够帮助企业提升成本管理效率,更好地达成优化目标。

  • 实施云上财务规划及管理:企业内部需要贯彻成本文化、建立成本责任制,由相关团队协作共同参与财务规划管理,在云上规划实施与组织架构相匹配的账号架构及财务管理模式。

  • 衡量投入产出比:设定业务目标及云成本预算,通过衡量投入产出比 (ROI) 推动云上成本持续优化。

  • 选择适合的资源及计费方式:全面了解业务目标及需求,除基础业务目标外还应包含工作负载在稳定性、性能、安全合规等方面的要求,根据业务需求选择适合企业的云产品及资源规格,结合业务特性及资源利用情况选择计费方式。

  • 为应用负载引入弹性机制:针对业务特性,为稳定的应用负载预留资源,为动态负载引入弹性伸缩机制,通过动态供应资源在满足业务目标的同时节约成本。

  • 持续监控及优化:成本管理及优化是一个反复迭代和持续运营的过程,需要在预算目标达成、成本构成、资源利用率等方面持续进行监控分析,在企业内建立定期检查及治理流程,发现问题并持续优化。

云上成本管理

云上成本管理框架

为了应对企业面临的云上成本管理挑战,国际上兴起了FinOps理论框架。根据FinOps官网《What is FinOps》的描述,“FinOps 是一种不断发展的云财务管理学科和文化实践,通过帮助工程师、财务、技术和业务团队协作制定数据驱动的支出决策,使组织能够获得最大的业务价值”。“FinOps”在行业中常见的别名有 “云成本管理(Cloud Cost Management)”、“云成本优化(Cloud Cost Optimization) ”、 “云财务管理(Cloud Financial Management)”等。

阿里云在FinOps核心理念基础上,融合自身实践经验,提出更加细化落地的“云上成本管理实施框架”,供企业客户参考实施。

(应用上云规划-应用上云实施-图5)  备份 5..jpeg

云上成本管理贯穿上云用云全生命周期

从企业上云及用云的历程看,大致可以分为用云计划、用云执行、监控分析、成本优化等阶段,成本管理贯穿各个阶段,每个阶段的关注点各有不同。

  • 用云计划阶段:场景包括企业首次上云、增量上云、存量复购,重点关注组织规划、财务规划、资源规划。

  • 用云执行阶段:场景包括采购执行、用云管云规则执行、商务履约执行,重点关注从财务管理和资源管理两个视角做好成本管理。

  • 监控分析阶段:对应FinOps的Inform阶段,主要解决成本分摊与成本可视化问题,重点关注成本分摊、成本监控及成本可视化。

  • 成本优化阶段:对应FinOps的Optimize阶段,主要通过计费方式优化、资源使用优化和架构优化来落地执行。

  • 持续运营:云上成本管理是一个反复迭代和持续运营的过程,企业应持续循环以上四个阶段,形成长效运作机制,使云上成本可以有效管控、持续优化。

人员、工具和机制是云上成本管理的关键要素

人员是基础,业务、财务和技术须协同运作

云成本管理团队是企业实施云成本管理的基础。云成本管理不是某一个角色或某一个团队需要做的事情,而是需要多个角色共同参与,打破原有各管一段,各自为战的传统 IT 管理方式,各角色长期协作共同努力以达到成本长期治理的目标。

工具是抓手,监控、分析与调优是必备能力

云成本优化工具是企业实施云成本管理与优化的抓手。云成本管理是一个复杂而耗时的过程,需要将各项能力沉淀到工具。需要将成本管理的能力沉淀为工具或平台,构建可度量指标,驱动实际各相关组织自助降本。

机制是保障,成本意识和奖罚机制双轮驱动

云成本管理相应的长效运营机制在云成本管控中起到关键作用,面对云成本特殊的支出模式和账单结构,企业需要更新一套更加合适的云成本管理流程制度确保优化工作能够在企业内部精确、高效运转。

用云计划阶段

用云成本需求分析

在实施用云成本规划时,首先要捕获用云成本需求,在计划时,通过对用云成本需求分析,确保相关干系人的业务需求保持一致,并使资源得到最大的利用率,使云成本在组织内部做到可管可控、可持续经营。建议企业级客户主要从以下几个方面关注用云成本需求:

  • 业务地域

  • 合规性

  • 安全性

  • 业务连续性和稳定性

  • 技术团队管理

  • 自动化和标准化

  • 成本优化目标

组织规划

做好组织规划是企业上好云、做好云上成本管理及优化的基础,在上云之前应根据企业的实际情况做好相关的组织规划,主要包括企业组织架构梳理、云上账号体系规划及权限体系规划。

财务规划

企业上云之后,企业的IT消费模型将会发生变化,主要包括基础设施采购方式、成本管理方式、成本类型、决策模式等,合理的财务规划能让企业上云后的成本管理更加高效。主要从以下方面进行财务规划:

  • 规划云上财务管理模型:在企业上云前,企业应对上云后的财务管理模型进行提前规划,确定包括优惠、信控、资金、发票及财务资产的管理策略。阿里云提供跨账号财务管理和跨账号财务托管解决方案,帮助企业实现共享优惠、共享信控、统一账单、统一发票等管理诉求。

  • 规划云上财务资产:企业财务管理通常具有权限集中性,基于合理规划的云上多账号财务管理体系能够提升财务资产管理效率。阿里云能够帮助企业做统一管控财务权益资产,包括主账号划拨资金、信控额度给子账号,同时可以进行回收等管理操作。

  • 规划云上预算:将云的预算管理纳入之后,企业的全面预算才能补齐最后一块短板,全面预算才有切实的管理意义。阿里云平台提供了费用预算、按量编制预算、使用率与覆盖率预算等方式,帮助企业在预算和预测流程中实施基于趋势或基于业务驱动因素的方法,两种方法也可以结合应用。

  • 对计费方式进行规划选型:根据业务特点对资源计费方式进行选型,例如能够预估资源使用量时可以选择预付费、使用量波动较大时考虑按量付费等,实现云上成本更优。阿里云为客户提供按量计费、节省计划、资源包等丰富的计费方式,兼顾成本与灵活性。

资源规划

资源规划帮助在成本需求分析后管理需求和供应资源。按照业务需求和成本需求进行资源规划,并在即时供应和预置需求之间取得平衡。对资源进行规划建议主要考虑以下方面:

  • 根据业务演进计划做资源规划:企业可通过调研业务部门未来一段时间的业务规划,梳理并列出适合业务并留有一定冗余量的资源规格和用量。

  • 规划阿里云资源区域:产品和服务的成本可能因位置而异,阿里云支持获取云产品区域和可用区列表。

  • 规划阿里云资源供应:主要包括云上计算资源、存储资源、流量资源规划,例如阿里云云服务器ECS提供资源管家帮助企业进行计算资源规划。

  • 规划配额:阿里云提供配额中心集中管理云服务配额,通过配额中心可以查询及提升云服务的配额限制;云服务器ECS提供配额权益,支持配额查看及提升。

  • 规划资源计费方式:根据业务特性选择合适的付费方式来优化成本,阿里云提供按量付费、资源包、节省计划和预留实例等计费方式满足不同业务场景。

  • 规划标签体系:良好的资源标签体系能够帮助企业提升资源管理效率及成本分摊效率。阿里云提供资源标签设计原则及预置标签产品能力,帮助企业更好地进行标签规划。

用云执行阶段

财务管理

企业上云后的财务管理也会因云计算的特性而发生改变,在用云过程中,可以使用阿里云提供的财务管理工具对钱、账、票和云上财务资产实现多组织跨部门的高效管理。建议从以下方面实施财务管理:

  • 管理云上资金:管理当前账号以及财务关联账号的资金收入、支出等,确保资金及可用额度充足,避免因资金问题导致服务中断。阿里云提供“收支明细”功能,帮助企业掌握当前账号以及财务关联账号的资金收入、支出等记录信息。

  • 定期关注账单:已经购买和消费的云产品通常以月账单的形式呈现,关注概览及明细账单是做好对账和结算的基础。阿里云支持月账单、月账单详情、账单流水、分账账单等多种形式账单。

  • 管理开票流程:根据消费金额开具发票,梳理需要单独或合并开票场景并在云上实施。阿里云支持对发票进行便捷管理,复杂场景下支持财务关联账号的便捷合并开票。

  • 实施统一结算:多组织多账号架构的财务结算相对复杂,建议在云上进行集中管理、统一结算。阿里云支持统一结算功能,让财务主账号统一支付关联子账号的历史账单,简化财务主子账号结算流程。

  • 管理财务资产:对多组织多账号架构的企业而言,尤其需要关注对资金、信控额度的划拨及回收进行管控,做好额度分配及隔离。阿里云提供财务资产管理能力,支持财务主账号对子账号进行资金、信控额度的划拨和回收、发票设置等。

资源管理

对资源进行分层分组管理是管好资源及资源成本优化的基础。阿里云资源管理服务是一系列企业IT治理产品和服务的集合,主要包括资源目录、资源组、资源共享和标签,帮助企业实现资源分层分组管理。可以使用资源目录在云上构建企业业务组织关系,使用资源组和标签分层管理云上资源,使用资源共享在企业成员之间共享云上资源。

成本分摊

将云上成本尽量准确地分摊到业务是云上成本管理的关键环节,是推进云成本持续优化的重要前提。将成本进行分摊才能落实成本责任制,定期对责任团队所分摊的成本进行监控分析,追踪超支原因,让责任团队能够主动、持续的优化成本。建议基于成本标签实现企业内各责任团队自动化分账,关键步骤包括:

  • 设计标签体系:对资源标签体系进行统一规划。阿里云提供标签设计原则及预置标签产品能力,帮助企业进行标签规划设计。

  • 设计财务单元:从费用归属视角设计财务单元目录树。阿里云用户中心提供财务单元能力,支持多维度自动化资源费用归属。

  • 为资源打成本标签:准确的资源成本标签是标签分账的基础,建议在创建资源时即进行打标。阿里云支持通过云产品控制台、标签控制台、OpenAPI等方式对资源进行打标。

  • 设定自动分摊规则:建议在财务单元中按标签设定自动分配规则,提升成本分摊效率。

  • 对成本标签进行审计:对成本标签进行自动化审计,提升标签覆盖度及准确性。阿里云提供标签策略能力,企业可以通过限定资源上必须绑定的成本标签,对标签进行自动检测及修复,提升标签管理效率。

监控分析阶段

监控预警

成本监控有助于发现成本问题和成本优化机会点,因此应该通过各种监控工具同时对成本数据和资源数据进行有效监控。通过预警的方式通知到相关的运维人员或财务人员,对发现的问题或优化机会进行跟踪处理,避免预期外费用、优化资源使用率,从而实现成本节约。建议从以下方面对成本进行监控预警:

  • 实施预算管理及预警:通过预算管理实现云上成本管理闭环,提高云上成本精细化管理水平。

  • 关注异常费用并设置预警:对费用异常进行自动化检测,及时发现成本异常,更快地定位问题发生原因、解决问题。

  • 设置资金可用额度预警:对可用额度进行预警,避免因资金问题导致服务中断。

  • 设置高额消费预警:在云产品维度对高额消费进行预警,及时发现异常消费、控制成本。

  • 设置资源包额度预警:对抵扣资源设置额度预警,避免发生抵扣资源不足的情况、推高资源成本。

  • 对云资源进行监控:监控云上云资源利用率,根据负载情况动态调整资源供应,充分高效使用云资源进而节省成本。

阿里云产品及服务能够覆盖上述监控预警需求,例如阿里云用户中心提供预算管理、费用异常检测、资金可用额度预警、资源包额度预警等功能,阿里云云监控(CloudMonitor)支持收集资源监控指标,并可针对指标设置警报。

成本可视化

通过成本分摊获得了有效分摊的成本数据,接下来可以采用成本可视化工具对成本进行多维度分析,找到更多的成本问题或成本优化机会。建议从以下方面实施成本可视化:

  • 定期进行成本分析:对云上成本进行多维度构成分析,发现优化机会。通过阿里云提供的成本分析功能,能够帮助用户从多维度查看资源成本趋势及成本构成。

  • 定期进行预实分析:对预算执行情况进行分析,找出预实差距,推动责任团队不断优化成本。通过阿里云预算管理能够帮助企业查看预算与实际消费金额的对比情况,发现实际执行与预算之间的差距。

  • 对抵扣资源进行分析:关注已经购买的资源包、预留实例券等抵扣资源,可定期查看和分析其实例生效状态、覆盖率等,防止抵扣资源浪费或抵扣不足造成成本上升。阿里云提供抵扣资源使用率和覆盖率分析报表,便于企业对抵扣资源的使用情况进行分析。

  • 对成本进行预测:定期分析并预测成本,有助于做好预算管理和财务规划。阿里云为客户提供成本预测算法,并支持在预算管理和成本分析两个场景中的预测。

成本优化阶段

计费方式优化

阿里云提供丰富灵活的计费方式,满足不同的业务场景需求,通过选择合适的计费方式,在满足安全、弹性的同时节约成本。计费方式优化通常无需改变资源性能和数量,仅通过改变计费方式即可获得更低折扣从而节省成本。考虑从以下方式进行计费方式优化:

  • 考虑参与节省计划:节省计划是阿里云提供的一种折扣权益计划,可抵扣按量付费实例的账单,通过承诺使用时长帮助用户节省成本。节省计划适用于电商大促、热点时间等泛互联网共振型业务,以及在线、离线、Job等混部型业务。

  • 在适合场景下使用抢占式实例:相对于按量付费ECS实例价格有一定的折扣,降低部分场景下使用ECS实例的成本。抢占式实例适用于无状态的应用场景,例如可弹性伸缩的Web站点服务、图像渲染、大数据分析和大规模并行计算等。

  • 考虑使用云数据传输进行网络计费:云数据传输(Cloud DataTransfer,简称CDT)提供云上流量统一计费和出账功能,提升对账便捷性,支持用的越多越便宜的阶梯计费模式。

  • 搭配资源包抵扣按量付费:在能够预估资源用量的情况下,通过购买预留实例券、存储容量单位包、资源包等抵扣资源降低按量付费资源使用成本,抵扣资源实例的售卖单价会比按量付费的单价更低。

资源使用优化

从资源使用维度对资源的进行优化是实现成本优化的有效手段。需要通过资源现状评估、合理选择及使用资源、对资源利用进行监控发现优化机会,结合业务特性、性能、成本等综合考虑后谨慎执行。资源使用优化建议遵循以下原则:

  • 定期评估资源现状:通过工具辅助人工方式定期对云上整体资源进行梳理、调整和更新,将资源可视化,指导资源优化方向。

  • 选择适合的云产品及资源规格:建议通过对应用进行分类及成本建模根据业务应用的特点分类选择适合的产品及规格。以计算资源为例,预先确定合适的机型选型以及应用属性配置,根据应用的业务选择合适的CPU/内存比例,考虑吞吐量要求及是否需要增强型的机型规格。

  • 设计资源架构并合理使用:企业需要根据云资源需求详细了解云产品使用最佳用法,设计符合业务场景的资源架构并持续治理优化。以存储资源为例,按数据生命周期合理划分存储单元、对日志数据进行加工分类、仅对必要的数设置索引等方式节约成本。

  • 为应用负载引入弹性机制:为稳定的应用负载预留资源,为动态负载引入弹性伸缩机制。申请云资源时按照最小需要的原则进行申请,跟随业务发展、访问量情况进行弹性扩缩容。可考虑使用阿里云弹性伸缩(Auto Scaling)及容器服务ACK(Alibaba Cloud Container Service for Kubernetes)等服务,帮助应用负载实现自动弹性伸缩,满足业务目标并优化成本。

  • 优化资源利用率:为应用负载配置资源利用率监控,获取资源使用水位分析报告和评估详情,根据利用率情况对资源进行扩缩容、升降配等方式节约成本。可定期使用云监控资源水位分析工具对特定周期内云资源的运行情况进行汇总分析,为后续资源规划及使用优化提供参考依据。

  • 管理存储生命周期:进行数据生命周期管理,根据数据修改及访问等情况进行冷热分层存储。例如阿里云对象存储OSS(Object Storage Service)支持基于访问时间的生命周期规则,自动监测数据的访问模式并识别冷数据,将识别出来的冷数据进行存储类型转换,从而达到数据的冷热分层存储,最终节约存储成本。

持续架构优化

对应用架构进行定期检查并持续优化能够充分利用云的优势,结合成本监控分析发现架构问题,获得更高资源利用率、系统可用性、可扩展能力,并节约成本。通过持续架构优化来优化成本建议关注以下方面:

  • 云原生化改造:将云应用中的非业务代码部分进行最大化的剥离,使业务具备轻量敏捷、高度自动化和资源按需消费等特点。

  • 探索混合部署:提升资源整体利用率,解决资源碎片问题并降低离线作业成本。

  • 计算存储分离:面向数据计算和存储场景的管理方式,高效按需扩容、节省成本。

  • 拥抱Serverless:服务化、模块化、可编排和可组装的架构,最大限度利用计算、存储、网络等全链路资源,提升整体资源利用率及需求交付效率。

平衡目标与成本

在应用负载的设计及资源选择过程中,除了成本因素还应考虑稳定性、性能、安全合规、IT运营效率等多方面要求,在各项目标与成本之间进行权衡。适合业务的应用负载设计并不意味着只追求低成本,单纯的低成本通常意味着在其它方面做出妥协。全面了解各方面需求后,可以按照业务特性对应用负载各方面要求进行权重排序,综合考虑后再做出选择。

  • 本页导读
文档反馈