规划与估算
为了在组织的云环境中基于特定模型部署工作负载,需要对预期成本和潜在价值进行评估和预测,并探索自动化、可持续性和成本优化方面的可能性。
探索不同云端场景
设定估算范围。
确定估算所需信息。
确定用于评估未来状态的模型参数。
估算每种场景的业务价值
使用计算器和估算工具探索成本、用量和对环境影响之间的关系。
与相似的应用和系统进行比较。
根据过去的成本和技术需求指标进行推断。
记录未来规划的预期影响。
利用试运行和非生产环境进行估算。
考虑定价、政策、碳排放目标、共享服务和其他支持成本。
规划实施
规划概念验证(PoC)。
为调优预测模型提出建议。
定义
云服务种类繁多,更新频繁,新兴服务、托管服务层出不穷,且云端构建应用、应用迁移上云的模型多种多样,因此需要一套健全的实践来估算工作负载或系统的长期成本。组织还需要根据其可持续性目标来估算和规划其资源消耗。这种估算的范围可能涵盖从单一服务变更到应用整体迁移上云的方方面面。通常,组织为对比多个场景下业务的潜在价值,会进行多次估算。
估算主要由工程人员负责,FinOps团队会提供支持。如果估算工作十分重要、影响重大或程序复杂,或者需要创建试验性预算,可能还需要产品、财务团队或管理层提供意见。
规划与估算与预测管理密切相关。进行估算是为了了解不同场景或用例下的潜在未来成本,以便为迁移、部署或现代化项目制定计划。估算结果是预测管理的输入。预测管理用于在为变更制定计划后,创建和维护适用于变更的详细预测模型。预测管理展示了工程或产品团队的应交付的预期支出和价值创造。
相比之下,规划与估算是探索性的,是云成本预测及其他活动的上游环节。为了支持优化云成本领域的活动,如云架构优化和工作负载优化,甚至是支持工作负载上云,经常需进行估算工作。
要估算未来云成本,组织要清晰定义需要估算的场景。这包括了解需要估算的服务、架构或变更方案、组织使用的技术部署模式以及便于沟通传达的估算参数。可能会针对一个特定变更设定各种场景。例如,工程团队可能会估算并比较将工作负载从虚拟机分别迁移到托管服务、Kubernetes环境和无服务器计算模型的成本、工作量和影响。
有一系列方法可用于估算云成本,包括:
成本计算器——由大多数云服务提供商和部分三方厂商提供,用于估算预期使用服务的成本。此类计算器擅长估算简单服务替换场景的成本,但在估算组织云环境中尚不存在的应用成本方面效果不佳。
碳排放计算器——利用云服务提供商和第三方提供的工具来估算当前的碳足迹。
与相似应用进行比较——适用于拥有一系列统一架构或应用的组织。如果一个新系统遵循惯用模式,工程师就可以通过比较已有系统的成本和性能,启动新变更或新工作负载的估算工作。
从历史成本进行推断——通过隔离单个服务的变更或使用,依据当前成本对未来成本进行推断,简化在现有系统实现变更的估算工作。适用于估算大型系统中孤立的服务变更。
对未来计划进行预估——云计算的按需使用模式,使组织能够节省成本,因为只有在真正需要资源时才进行云端部署。因此,对整个系统进行大规模估算时应考虑到所有必需资源和环境的分阶段部署。例如,要创建一个云端新系统,刚开始可能只需要部署开发和测试环境,数月后开发接近尾声时再部署生产环境。那么估算时就应该结合这个系统的未来规划估算分阶段部署的成本,而不应一次性估算所有环境的成本。
试运行估算——利用IaC(基础设施即代码)脚本等自动化工具,可以快速构建和销毁云服务。因此组织可以通过在云平台上实际创建测试环境、运行1-3天,然后将其删除来准确估算成本。此方法虽然会产生少量费用,需从研发或预算资金中支出,但能获得更真实的成本估算结果,同时还能验证IaC脚本的有效性。
在所有方法中,工程人员应与FinOps团队合作,确保估算符合云政策(例如应在何处创建资源、使用哪些类型的资源、适当的架构模型等),确保费用估算合理(按需定价、折扣率、预期资源使用承诺等级等),并且估算涵盖了共担成本、平台调整和其他支持成本及影响。这些影响不局限于财务成本,还应包含其他因素,如对可持续性的影响和实施变更对运营的影响等。
估算场景可以用来为预测过程提供输入,或者反馈给触发了估算工作的优化过程。如果需要PoC(概念验证)预算来进行估算或获取更具体的成本信息,则需要财务部门参与其中。
遗憾的是,没有一种估算方法是万能的。云支出的可变性本就使其难以预测,工程师们还常常不经采购流程就可以随时创建环境和工作负载,因此,拥有完善的估算能力至关重要,需要有明确的参数、场景规划、工具及文档记录的要求。
成熟度评估
爬行
使用简单或一致的应用构建模式,需要较少或更直接的估算技术。
由于组织的云支出较低或不成熟,估算不需要非常精细或准确。
组织中的各利益相关方使用不同云成本数据源和工具进行预测,不要求一致性。
由于用量低或场景规划简单,估算通常手动记录或临时进行。
更依赖于基于趋势的推断,而不是复杂机制。
对汇总整体估算视图的需求有限(可能只按业务部门或成本中心)。
完成估算所需的共享成本或附加成本要素较少。
工程团队参与估算的创建,但几乎不需要跟踪估算值与实际值的差异。
使用云服务供应商的工具和看板来衡量当前的碳足迹。
了解云资源的使用与碳足迹之间的关联。
行走
使用更广泛的应用构建模式或用云情况复杂,需要借助更多估算技术。
估算在服务层级上更加细化,并且组织层面对估算的准确性要求更高。
估算时考虑云费率优化、承诺折扣和碳排放目标。
定期进行估算,有统一的记录方式,但尚未实现自动化。
FinOps核心和关联角色(产品、管理层、工程、财务、可持续发展)有权访问云成本估算数据。
FinOps团队定期审查估算准确性,与相关团队一起审查估算趋势。
奔跑
复杂且大规模的构建模式和云使用情况需要复杂的估算方法。
估算极其精细,包括多种类型的共享成本元素、平台成本、支持成本、可持续发展和政策合规性元素。
估算通过多种定价模型创建,包括、折扣调整、摊销云用量定价。
估算场景支持滚动、趋势维度和驱动因素维度的预测管理能力。
估算中包含了优化机会。
估算与组织内部用于报告云成本的分配结构相一致。
基于组织 KPI,细化估算颗粒度(按业务部门、成本中心、团队、产品、服务等)
FinOps核心角色和关联角色(产品、管理层、工程、财务、可持续发展)可以实时查看单一真实来源,了解云资源使用如何影响估算、预测、趋势、碳足迹和预算。
实现云成本预测数据、ESG(环境、社会和公司治理)和后端会计系统间的集成和数据流自动化,便于更广泛的组织报告。
职能活动
FinOps从业者
为产品和工程团队设定估算要求和参数。
生成合理、准确的细粒度估算结果。
帮助建立与业务目标一致的估算KPI。
提供云成本估算结果,各利益相关者能够据此创建预测模型。
参与实施规划,对定价、政策、分摊成本和其他影响进行情景估算。
为各团队提供按不同业务维度划分的预计支出细粒度报告。
协调全估算流程的相关角色和利益相关者。
提供有关估算准确性趋势的报告。
产品
跟踪以产品为中心的关键绩效指标(KPI),衡量实现预期业务成果的性价比。
与FinOps可持续性角色合作,跟踪产品、部门或工作负载的单位碳排放水平(二氧化碳当量公吨MTCO2e)KPI,核算碳足迹。
在与工程团队的合作中使用这些KPI为估算场景提供信息。
设定与我负责的产品线一致的估算参数。
财务
制定估算准确性和精细度的要求。
帮助设定与业务目标一致的估算KPI。
提供云成本数据,使利益相关方能够进行预测,从而帮助我制定预算。
向各团队提供按不同业务维度预测支出的详细报告。
提供预算与实际值、预测、估算的对比报告,以识别趋势并与方差KPI进行比较。
适时提供试验资金,以输出更准确的估算结果。
工程
监控云支出预测是否超出预算,触发估算工作。
监控优化、迁移、架构设计是否触发对新资源的估算工作。
与FinOps核心和关联角色(如FinOps从业者、产品和可持续性团队)合作,按需创建有价值的估算场景。
理解在各种情况下应考虑的所有估算场景。
为影响云支出预测/预算的计划变更获取批准。
领导我所负责领域的估算工作。
在预测模型可用的情况下,了解何时需要新的估算,以及理解这些估算如何影响我负责的现有预测模型。
在设计和构建基础架构时考虑成本、优化和碳排放。
管理层
了解估算云成本及其影响的流程,并支持工程人员开展这项工作。
设定与业务目标一致的估算方差阈值。
当估算支出影响高优先级项目的预算时,管理有冲突的项目时间表的优先级。
促进FinOps核心和相关角色之间的沟通,确保技术支出和ESG优先级与业务目标一致,从而创造价值。
在需要比较不同估算场景时,权衡和作出规划决策。
可持续发展
提供碳足迹的实际值和估算值,使利益相关者能够据此建立ESG预测模型。
与FinOps核心角色和ESG团队合作,了解并建立组织的可持续发展目标。
使用云服务供应商的工具向 更广泛的FinOps和 ESG团队提供碳足迹报告。
成功衡量标准和KPI
使用折扣调整后的摊销云使用数据建立估算模型。
估算成本与实际成本趋势的差值在设定的百分比阈值内。
采用与业务目标相关的合适机制快速进行估算。
估算时考虑共享成本、合理定价指标、环境可持续性影响和其他相关要素。
建立定期会议的时间安排。
制定组织特有的单位成本和用量KPI(可以使用私人定价协议PPA、企业折扣计划EDP等),帮助更准确地进行预测。
输入和输出
输入
从工作负载优化触发估算
从费率优化触发估算
从报告与分析触发估算
从工作负载上云触发估算
从预测管理触发估算
当前系统或工作负载的详细信息
目标位置、模型中系统或工作负载的功能性和非功能性需求
需要建模的场景细节
系统或工作负载的期望状态,或未来变更计划
当前的架构指导方针(云架构优化)
所需的估算参数(时间范围、精确度等)
FinOps从业者需关注ESG法规和标准
需要验证准确性的数据
输出
系统或工作负载在特定场景下的成本、碳排放和交付估算
基于多种竞争性场景估算的建议
潜在风险和置信度
用于数据验证的数据质量记分卡(包含KPI、验证频率等)