工作负载上云
当系统迁移上云或在不同云环境之间迁移时,确保相关人员能够清楚了解成本、资源使用及其影响,同时确保上云有助于达成运营目标,提升成本效益。
管理上云策略
制定选择标准,确定需要上云的系统。
制定价值与工作量对比矩阵,确定候选接入系统。
定义成功标准。
规划迁移
制定财务可行性案例。
对比源环境和目标环境的业务价值。
评估迁移对服务和应用的功能和可用性的影响。
协调上云
综合地域、冗余、可用性和费率因素,建立云上Landing Zone。
确定上云的里程碑。
建立稳健的项目管理流程和工作流。
确定相关人员的角色和职责。
定义
将工作负载迁移到云环境或在云环境之间迁移需要进行提前规划、与利益相关者沟通协调以及制定组织策略,从而明确哪些工作负载和系统以何种方式进行迁移。为了成功将一个或多个系统迁移到云端,或从一朵云迁移到另一朵云,组织需要开展多个FinOps能力的职能活动。
工作负载上云通常是为了减少或关闭数据中心或淘汰资本资产,或是为了应对并购、采用新兴云技术或本地云技术,或仅是为具有独特使用模式的应用寻找性价比最高的运行环境。
对于任何将应用迁到公共云或专有云,尤其是从数据中心迁走的组织来说,上云策略至关重要。复杂应用或工作负载的上云还需要详细的迁移计划。通常,云服务提供商、第三方顾问或供应商可以协助组织进行迁移的估算和规划,但在执行迁移计划前,组织必须了解需要上云的系统、上云的条件,并制定上云的成功衡量标准。
上云策略很大程度上依赖于组织的整体云战略。组织试图通过迁移上云来实现的目标——加快创新、提高安全性、增强可靠性、减少成本等——都将受到选择上云的应用及其迁移方式的显著影响。系统是否需要扩缩容?使用量是否多变?对成本预测是否有信心?系统的云上架构是否合理?一旦迁移上云,是否有成熟的资源来优化和运行系统?制定上云策略需要进行充分的思考,让工程、财务、管理层、产品团队和可能的相关角色都参与进来。
如此一来,迁移规划才能有效呈现系统上云的时间、方式、手段等相关信息。通过在系统的生命周期早期进行设计,可以最大限度地提高成本效益。工作负载上云是结合使用FinOps的云架构优化能力及其他卓越架构主流产品的最好时机之一。
系统的上云无法孤立进行。其他应用、操作系统和云上Landing Zone都将受到新上云的工作负载的影响。因此应用资源需要遵守包括标签要求在内的云政策,确保工作负载对相关工作流(如自动化、成本分摊等)具有适当可见性。FinOps团队还需结合估算用量和预测模型,确保合理规划和执行费率和用量优化。
上云KPI对衡量迁移是否成功至关重要。迁移,尤其是从数据中心到云的迁移,通常会遇到难以克服的障碍。在两种环境中并行运转可能会造成意料之外的财务或可持续性方面的影响,并行时间越长,成本可能越高。持续密切关注和管理上云进展至关重要,尤其当进行大规模迁移时,组织可能进行大量投资。根据组织的云采用策略,这一情况可能会使核心FinOps团队不堪重负,或在组织内引发艰难的优先级排序讨论。
组织需要为工作负载制定正式的上云流程,并不断迭代。此上云流程将从测试或开发环境开始,并显示如何将应用迁移到预发和生产环境。在绝大多数组织中,迁移上云将持续很长一段时间,因此推动协作至关重要。
成熟度评估
爬行
组织的上云需求非常小,或者组织刚刚起步,几乎不需要不同角色之间就工作负载上云进行协作。
按需为工作负载上云进行临时预算和资金申请。
由于需求简单,可通过手动或脚本创建Landing Zone和执行策略,如创建标签。
行走
迁移规模更大或更复杂的系统时,组织需要建立更结构化、可重复的上云流程,各角色需要遵循该流程。
各角色团队参与上云计划和项目管理,定期检视上云状态。
系统上云必须执行估算、预测和预算流程,但这些流程在各业务部门或产品团队之间尚未标准化。所有IT请求变更都需纳入考虑。
在Landing Zone、策略合规、治理和共享服务集成方面实现较高程度的自动化。
核心团队管理云使用报告,包括应用级报告。
奔跑
为将完整数据中心或系统组合迁移上云,组织需要建立复杂、持续且高度自动化的上云流程,以投入所有必要的角色及其他能力。
流程和指导方针清晰明确,体现部署新项目/应用或将现有工作负载迁移上云的财务和技术可行性。
组织对自动化进行投资,使用IaC(基础设施即代码)来构建,确保一致性和策略合规。
全组织标准化预算和预测流程,各团队遵照执行。
上云过程中具备有效监控机制供各团队监控迁移状态和成本。
职能活动
FinOps从业者
与产品、工程团队和管理层合作制定满足组织目标的上云策略。
与应用负责人合作,确保使用合理标签、合规方式、自动化和迁移模式。
管理或支持负责整个上云项目的人员,使所需信息和其他能力透明、可接入。
工程
根据上云策略评估工作负载迁移上云的适用性。
审核运营准备是否就绪。
确保团队正充分利用现有自动化流程或寻找任务自动化机会。
与自动化和产品团队合作,遵守云政策和云治理规定。
与FinOps团队合作确定最佳上云方案,实现高性价比、低影响的运营。
财务
评估工作负载上云的财务可行性。
与FinOps和产品团队合作,了解工作负载上云计划以及其潜在成本影响。
记录和跟踪云价值效益实现情况。
采购
与财务和FinOps团队合作,了解系统上云对现有订阅承诺和合同安排的影响。
检视将纳入新工作负载的开源工具和项目(也是法律职能活动)。
产品
利用新的云能力优化我的产品,提高效率和敏捷性。
倡导构建高性价比的应用架构,充分利用自动化构建应用或工作负载。
与FinOps团队合作,寻找工作负载上云后的优化空间。
协助工程团队根据业务需求做出优先级决策。
管理层
充分了解背景信息,为工作负载上云优先级排序。
提供战略方向,建立合理上云策略。
协助团队在多个竞争项目中做出权衡取舍。
关联角色
合理运用职责相关信息(如ITAM、安全、ITFM、可持续发展等)支持上云项目。
成功衡量标准和KPI
通过基础设施节省、迁移成本和支持成本来衡量成本效率。
提升服务质量和安全性。
通过加快产品和服务交付的流动性来缩短上市时间。
由于工作负载上云会影响业务的诸多方面,因此可以使用丰富的KPI 来有效衡量组织工作负载上云的效果。查看KPI库,选取适用于组织的指标。
输入和输出
输入
云架构优化——在设计基础设施初期考虑成本效率是最佳时机,此时可以针对工作负载综合考虑所有不同限制和变量。
合规与治理——确保工作负载符合组织和团队政策和治理规定,助力上云流程顺利进行。
FinOps工具与服务——组织所用工具应能检测环境中的新工作负载,工作负载应满足遵守标签策略,确保相关团队能利用工具查看工作负载。
工作负载优化——在上云阶段利用IaC(基础设施即代码)和自动化流程,简化寻找工作负载或应用程序优化空间的流程。
上云估算、预测和预算。
输出
制定上云策略,以确定将哪些系统迁移上云。
制定迁移计划并进行估算。
确定迁移时间表及项目可交付成果,以跟踪进度,供所有相关角色查阅。
阿里云相关能力
- 本页导读 (1)
- 定义
- 成熟度评估
- 职能活动
- 成功衡量标准和KPI
- 输入和输出
- 阿里云相关能力