发布风险智能评估是云效 AppStack 推出的智能化发布能力,面向容器服务 Kubernetes 版(ACK)集群的分批发布场景。在首批发布暂停时,系统自动调用云监控 2.0 的智能运维能力,对已发布的 Pod 进行健康状态分析,帮助你在继续发布前判断是否存在风险。 目前该功能处于Beta版。
功能概述
在 Kubernetes 应用的分批发布过程中,第一批次的稳定性直接关系到后续批次的发布决策。传统方式需要运维人员手动检查监控指标、日志和事件,效率低且容易遗漏关键信息。
发布风险智能评估提供以下价值:
自动化风险检测:首批发布暂停时,自动汇总观测数据,无需人工介入。
多维健康分析:结合 Kubernetes 事件、Pod 指标和应用日志,全面评估 Pod 健康状态。
决策辅助:在部署单页面直观展示分析结果,帮助你快速判断是否继续发布或回滚。
工作原理

发布风险智能评估的工作流程如下:
在 AppStack 发布单中发起 ACK集群的Kubernetes 应用的分批发布。
第一批次发布完成,发布流程进入首批暂停状态。
云效调用云监控 2.0 的智能运维能力,基于配置的时间窗口,对首批 Pod 进行多维度健康分析。
分析完成后,在部署单页面展示风险评估报告,包含健康状态、风险项和建议。
根据报告内容,决定继续发布后续批次或执行回滚操作。
分析触发后,通常在数分钟内完成。具体时间取决于集群规模和日志数据量。
前提条件
使用发布风险智能评估功能前,需满足以下条件:
已创建容器服务 Kubernetes 版(ACK)集群。
应用使用 Kubernetes 部署方式,并配置了分批发布策略。
分批发布策略开启了首批暂停。
配置发布风险智能评估
在 AppStack 环境中开启发布风险智能评估:
登录云效 AppStack 控制台。
在左侧导航栏选择应用,找到目标应用。
进入环境页面,选择需要配置的环境,并单击环境设置。
在环境设置详情页:
部署方式:Kubernetes 部署
Kubernetes 资源:选择目标ACK 集群。
开启发布风险智能评估开关。
说明仅当发布方式为 Kubernetes 部署且选择 ACK 集群时,发布风险智能评估配置项才会显示。如果使用其他部署方式或集群类型,该功能不可用。
配置指标数据时间窗口。系统将基于该时间段内的数据进行风险分析,默认为第一批Pods部署完成后的3分钟。

单击确定,完成配置。
等待第一批次发布完成,发布状态变为首批暂停。
在左侧导航栏,选择部署单。
在部署单详情页,查看分析结果,包括:
健康状态:显示首批 Pod 的整体健康情况。
健康状况描述:列出检测到的异常或潜在风险。

常见问题
为什么看不到发布风险智能评估配置项?
请检查以下条件是否满足:
发布方式是否为 Kubernetes 部署。
选择的集群是否为 ACK 集群。
ACK 集群是否已接入云监控 2.0。
风险评估报告显示无数据怎么办?
可能原因及解决方案:
云监控 2.0 未正常接入:确认集群已正确接入,可登录云监控控制台查看数据是否正常上报。如何接入请参见阿里云容器服务 ACK 接入云监控2.0。
时间窗口过短:尝试增大指标数据时间窗口,确保有足够的数据进行分析。
应用日志未采集:检查日志采集配置,确保应用日志能被云监控 2.0 采集。参考文档云监控 2.0 纳管应用运行时 LogStore。