云架构优化

更新时间:

云架构的设计和现代化应当注重成本效益和效率,在实现性能、可扩展性和运营目标的同时,最大限度地提升业务价值。

评估需要关注的系统

  • 确定目标。

  • 平衡成本、可持续性和运营设计因素。

理解具有成本效益的设计

  • 理解云上架构和服务使用模式。

  • 理解架构变更的影响。

  • 综合考虑规模、云成本、技术能力和业务目标。

建立高效的节奏

  • 制定计划并采取行动。

  • 持续现代化改造。

定义

云架构优化最有力的优势之一是能够使用各种组件和服务来构建系统,满足各种需求。构建云应用程序的方法有很多。工程和产品团队根据应用程序的需求、程序员的知识和能力、所需的运营环境等因素做出决策,以满足客户或利益相关者的需求。

对于希望创建新系统或将希望从传统数据中心迁移上云的架构师来说,选择范围非常广泛。计算方面的需求可以通过虚拟机、容器(云托管和自托管)、Serverless模式、全托管应用程序来满足。可以使用数十种数据库和分析平台,或者由组织自行构建和管理所需平台。此外,还有数百种服务可供客户选择,既可以构建复杂的单体企业应用程序,也可以设计高度分布式的微服务架构。

云服务供应商和其他平台供应商提供云卓越架构或云采用框架,指导工程师在云中高效地构建系统,作出有效的选择和权衡。这些框架包括系统的各个运营方面,如安全性、性能、可靠性,以及重要的可持续性和成本效益。

随着FinOps的引入和云的广泛使用,工程和产品团队不仅有责任选择满足其系统运营要求的服务,还要对这些系统的可持续性和财务可行性负责。

与其他系统指标一样,若想实现成本效益,最好的方式是将成本考量纳入系统设计,在系统开发生命周期内尽早规划。在早期明确并牢记系统的终极目标,可以帮助我们更轻松地搭建满足冗余、安全、可靠性、碳效率或成本效益等要求的架构,避免为将来遗留技术问题。

在某些情况下,应用程序直接在云中搭建,利用原生云服务,在设计伊始就考虑了高效运作的要求。但很多时候,应用程序需要从数据中心或其他云迁移到目标云上。此外,还存在多样情况,比如应用程序偏离了其原始设计标准、云服务供应商更改或引入了新服务,或者组织采用了此前不可行的开发或部署模式。

在每个云应用的全生命周期内,组织都必须评估何时需要调整架构设计。分析支出或浪费较高的领域,或未实现预期价值的领域,有助于识别哪些系统能够受益于架构现代化。那些已经发现存在效率问题的系统,或使用较旧技术或服务构建的系统,能够从架构现代化计划中获益。应定期进行分析,以评估云架构优化能够在哪些领域为组织带来益处。每个组织都会采取此类行动,以经济高效的方式构建和维护其系统和云资产,并在设计时想办法提高成本效益。

优化云成本领域内的所有能力都密切相连,因为每项能力都为组织提供了不同的思路来提高云价值。与费率优化和工作负载优化一样,云上架构能力新增了重新设计系统的选项,以充分利用云中可用的众多服务。该领域的其他能力提供了使用软件许可与SaaS模型以及直接解决可持续性问题的选项。这些领域的能力代表了组织在改善系统成本结构和提升系统价值方面可采取的所有行动。此能力还与工作负载上云能力紧密相连,后者主要针对在云中创建或迁移工作负载。在迁移这些解决方案时适当地进行架构设计十分关键,并且此能力涉及的架构模式和分析将为迁移决策提供参考。即使组织最终仍决定从数据中心“直接迁移”应用程序,提前分析低效之处也将有助于未来在必要之时对其进行现代化改造,提升整体价值。

成熟度评估

爬行

  • 组织中使用的应用程序或架构模式很少,需要进行架构现代化改造的频率较低。

  • 由于应用程序目录易于管理,因此根据需要不定时执行非正式的审查流程。

  • 工程师能够通过个人研究或非正式渠道评估更具成本效益的架构选项。

行走

  • 组织使用的重要应用程序或大部分架构模式需要频繁或结构化的审查,以确定架构改进能够提供价值的领域。

  • 定期(每月、每季度)执行正式的审查流程,或聚焦之前被判断为可能需要改进或重新设计的模式。

  • 工程师和架构团队积极致力于优化开发和部署模式,提升当前和未来的应用程序的成本效益。

  • 增加云服务提供商、供应商和外部资源的参与度,确定成本效益目标和具有成本效益的架构选项。

奔跑

  • 由于应用程序数量众多、架构高度专业化、用云情况复杂、架构模型多样化,因此需要进行频繁和结构化的系统审查。根据成本、重要性、特定的浪费模式等对系统进行优先级排序。

  • 由于需要评估的系统数量众多或结构复杂,需要建立正式的系统审查流程。

  • 明确定义流程和指南,包括架构现代化活动的财务可行性和技术可行性。

  • 确定更为标准化的架构程序和批准的模板、部署方法和开发模式,促进不同系统或服务的现代化活动。

  • 确立完成现代化后的评估流程,确保架构师吸取经验以改进未来的设计。

职能活动

FinOps从业者

  • 评估云上工作负载的财务可行性以及现代化改造的潜在影响。

  • 记录并追踪云价值收益的实现。

产品

  • 持续学习和了解我的产品所使用的服务。

  • 定期评估我的产品,确定何时使用新的云功能来提高效率。

  • 探索新的应用场景,进一步在云上创新。

财务

  • 评估云上工作负载的财务可行性以及现代化改造的潜在影响。

  • 记录并跟踪云价值收益实现。

工程

  • 持续关注和了解组织内部和整个行业的云服务、部署模式和开发模式。

  • 评估我所负责的工作负载是否适合在云上运行。

  • 评估在云环境中运行工作负载所需的准备工作是否到位。

  • 根据已发布或规定的架构跟踪并评估我的工作负载。

管理层

  • 作出明智的决策,确定要进行现代化改造的工作负载的优先级。

  • 提供战略方向,将通过工作负载云上现代化改造节省下来的资金投入到业务计划中。

成功衡量标准和KPI

  • 通过基础设施成本的节约、迁移成本和支持成本来衡量成本效益。

  • 提升运营韧性,从而改善服务质量,优化安全风险防控能力

  • 通过加快产品和服务交付的流动性来缩短上市时间。

  • 营造快速试验文化,推动创新和云转型。

  • 将环境和社会可持续性理念融入整个组织中。

输入和输出

下表按类别罗列了评估上述成功衡量指标所需的信息:

类别

输入

成本效益

  • 基础设施成本

  • 支持服务的成本

  • 架构现代化实施成本

  • 系统的价值指标

弹性

  • 服务质量

  • 安全性

  • 运营稳定性

速度

  • 开发人员生产力

  • 发布频率

  • 业务敏捷性

创新

  • 创新回报

  • 员工体验

  • 客户满意度

可持续性

  • 碳足迹

  • 电力使用效率

  • 循环经济

输出

  • 架构现代化分析的分类和节奏。

  • 云上系统现代化、系统搭建或重新设计相关机会的优先级列表。

阿里云相关能力

企业账号

卓越架构

计算资源优化

网络优化

资源使用优化-资源水位分析