自 2025 年 04 月 14 日 00:00:00(UTC+8)起新用户在云监控中不再提供 Kubernetes 容器监控能力,请参见公告:云监控 Kubernetes 容器监控功能变更通知。建议您统一使用可观测监控 Prometheus 版提供容器监控,请参见容器可观测。
您可以为容器服务Kubernetes版的集群、节点或容器组(pod)创建报警规则。当符合报警规则时,云监控自动发送报警通知,便于您及时了解容器服务的异常并快速进行处理。本文为您介绍创建、查看、修改、删除、暂停和启用报警规则的操作方法。
前提条件
- 请您确保已开通容器服务Kubernetes版,且已创建集群。具体操作,请参见快速创建ACK托管集群。 
- 请您确保容器服务Kubernetes版集群的metrics-server组件已升级到V0.3.8.5及以上版本。具体操作,请参见升级集群至v1.12版本前升级metrics-server组件。 
- 对于2024年04月25日10:00:00以后创建的容器服务Kubernetes版集群,请您确保已手动开启metrics-server组件的云监控功能。具体操作,请参见开启容器服务Kubernetes版集群的云监控功能。 
创建报警规则
- 登录云监控控制台。 
- 在左侧导航栏,选择。 
- 在Kubernetes容器监控页面,单击目标集群对应操作列的报警规则。 
- 在报警规则页面,单击创建报警规则。 
- 在创建报警规则面板,设置报警规则相关参数。 - 参数 - 描述 - 资源范围 - 报警规则的作用范围。取值: - 集群:报警规则作用于目标集群。您需要选择集群名称。 
- 节点:报警规则作用于目标集群的全部节点或指定节点。您需要选择集群及其节点。 
- 容器组(pod):报警规则作用于目标集群的指定命名空间下应用中的全部容器组或指定容器组。您需要先选择集群及其命名空间,再从无状态、有状态、守护进程集、任务或定时任务页签中选择部署应用和容器组(pod)。 说明- 在容器组页签,您仅需选择容器组(pod)。 
 - 规则描述 - 报警规则的主体。当监控数据满足指定条件时,触发报警规则。 - 通道沉默周期 - 报警发生后未恢复正常,间隔多久触发一次同级别的告警。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。 
- 某监控指标达到报警阈值时发送报警,在通道沉默周期内如果触发的告警级别不变,该规则不会再次发送报警通知;当告警级别发生变化(恢复正常也算级别变化)或者间隔时间超过通道沉默周期,该规则才会再次触发告警。 说明- 报警历史有两种状态,一种是通道沉默周期,表示同一个资源在通道沉默周期内不发送通知的状态。另一个是通知沉默,表示不同资源在通道沉默周期内不发送通知的状态 
 - 生效时间 - 报警规则的生效时间。报警规则只在生效时间内才会检查监控数据是否需要报警。 - 报警回调 - 公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用阈值报警回调。 - 报警联系组 - 发送报警的联系人组。 
- 应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。 
- 关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系人组。 
 
- 单击确定。 
查看报警规则
- 登录云监控控制台。 
- 在左侧导航栏,选择。 
- 在Kubernetes容器监控页面,单击目标集群对应操作列的报警规则。 
- 在报警规则页面,单击目标报警规则对应操作列的详情或报警历史。 - 查看报警规则的详细信息、报警历史和故障资源。 
修改报警规则
- 登录云监控控制台。 
- 在左侧导航栏,选择。 
- 在Kubernetes容器监控页面,单击目标集群对应操作列的报警规则。 
- 在报警规则页面,单击目标报警规则对应操作列的修改。 
- 在修改报警规则面板,修改报警规则相关参数。 
- 单击确定。 
删除报警规则
- 登录云监控控制台。 
- 在左侧导航栏,选择。 
- 在Kubernetes容器监控页面,单击目标集群对应操作列的报警规则。 
- 在报警规则页面,先单击目标报警规则对应操作列的  图标,再单击删除。 图标,再单击删除。
- 在删除报警确认对话框,单击确认。 
禁用报警规则
创建的报警规则默认处于正常状态。
- 登录云监控控制台。 
- 在左侧导航栏,选择。 
- 在Kubernetes容器监控页面,单击目标集群对应操作列的报警规则。 
- 在报警规则页面,先单击目标报警规则对应操作列的  图标,再单击禁用。 图标,再单击禁用。
- 在禁用报警规则确认对话框,单击确认。 
启用报警规则
当报警规则状态为已禁用时,您可以对其执行启用操作。
- 登录云监控控制台。 
- 在左侧导航栏,选择。 
- 在Kubernetes容器监控页面,单击目标集群对应操作列的报警规则。 
- 在报警规则页面,先单击目标报警规则对应操作列的  图标,再单击启用。 图标,再单击启用。
- 在启用报警规则确认对话框,单击确认。