发布风险智能评估

更新时间:
复制为 MD 格式

发布风险智能评估是云效 AppStack 推出的智能化发布能力,面向容器服务 Kubernetes 版(ACK)集群的分批发布场景。在首批发布暂停时,系统自动调用云监控 2.0 的智能运维能力,对已发布的 Pod 进行健康状态分析,帮助你在继续发布前判断是否存在风险。 目前该功能处于Beta

功能概述

在 Kubernetes 应用的分批发布过程中,第一批次的稳定性直接关系到后续批次的发布决策。传统方式需要运维人员手动检查监控指标、日志和事件,效率低且容易遗漏关键信息。

发布风险智能评估提供以下价值:

  • 自动化风险检测:首批发布暂停时,自动汇总观测数据,无需人工介入。

  • 多维健康分析:结合 Kubernetes 事件、Pod 指标和应用日志,全面评估 Pod 健康状态。

  • 决策辅助:在部署单页面直观展示分析结果,帮助你快速判断是否继续发布或回滚。

工作原理

umodel

发布风险智能评估的工作流程如下:

  1. 在 AppStack 发布单中发起 ACK集群的Kubernetes 应用的分批发布。

  2. 第一批次发布完成,发布流程进入首批暂停状态。

  3. 云效调用云监控 2.0 的智能运维能力,基于配置的时间窗口,对首批 Pod 进行多维度健康分析。

  4. 分析完成后,在部署单页面展示风险评估报告,包含健康状态、风险项和建议。

  5. 根据报告内容,决定继续发布后续批次或执行回滚操作。

说明

分析触发后,通常在数分钟内完成。具体时间取决于集群规模和日志数据量。

前提条件

使用发布风险智能评估功能前,需满足以下条件:

配置发布风险智能评估

在 AppStack 环境中开启发布风险智能评估:

  1. 登录云效 AppStack 控制台。

  2. 在左侧导航栏选择应用,找到目标应用。

  3. 进入环境页面,选择需要配置的环境,并单击环境设置

  4. 在环境设置详情页:

    • 部署方式:Kubernetes 部署

    • Kubernetes 资源:选择目标ACK 集群。

    • 开启发布风险智能评估开关。

      说明

      仅当发布方式为 Kubernetes 部署且选择 ACK 集群时,发布风险智能评估配置项才会显示。如果使用其他部署方式或集群类型,该功能不可用。

    • 配置指标数据时间窗口。系统将基于该时间段内的数据进行风险分析,默认为第一批Pods部署完成后的3分钟。

      image

  5. 单击确定,完成配置。

  6. 等待第一批次发布完成,发布状态变为首批暂停

  7. 在左侧导航栏,选择部署单

  8. 部署单详情页,查看分析结果,包括:

    • 健康状态:显示首批 Pod 的整体健康情况。

    • 健康状况描述:列出检测到的异常或潜在风险。

    image

常见问题

为什么看不到发布风险智能评估配置项?

请检查以下条件是否满足:

  • 发布方式是否为 Kubernetes 部署。

  • 选择的集群是否为 ACK 集群。

  • ACK 集群是否已接入云监控 2.0。

风险评估报告显示无数据怎么办?

可能原因及解决方案:

  • 云监控 2.0 未正常接入:确认集群已正确接入,可登录云监控控制台查看数据是否正常上报。如何接入请参见阿里云容器服务 ACK 接入云监控2.0

  • 时间窗口过短:尝试增大指标数据时间窗口,确保有足够的数据进行分析。

  • 应用日志未采集:检查日志采集配置,确保应用日志能被云监控 2.0 采集。参考文档云监控 2.0 纳管应用运行时 LogStore