管理报警规则

您可以为容器服务Kubernetes版的集群、节点或容器组(pod)创建报警规则。当符合报警规则时,云监控自动发送报警通知,便于您及时了解容器服务的异常并快速进行处理。本文为您介绍创建、查看、修改、删除、暂停和启用报警规则的操作方法。

前提条件

创建报警规则

  1. 登录云监控控制台

  2. 在左侧导航栏,选择云资源监控 > Kubernetes容器监控

  3. 容器监控页面,单击目标集群对应操作列的报警规则

  4. 报警规则页面,单击创建报警规则

  5. 创建报警规则面板,设置报警规则相关参数。

    参数

    描述

    资源范围

    报警规则的作用范围。取值:

    • 集群:报警规则作用于目标集群。您需要选择集群名称。

    • 节点:报警规则作用于目标集群的全部节点或指定节点。您需要选择集群及其节点。

    • 容器组(pod):报警规则作用于目标集群的指定命名空间下应用中的全部容器组或指定容器组。您需要先选择集群及其命名空间,再从无状态有状态守护进程集任务定时任务页签中选择部署应用容器组(pod)

      说明

      容器组页签,您仅需选择容器组(pod)

    规则描述

    报警规则的主体。当监控数据满足指定条件时,触发报警规则。

    通道沉默周期

    报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。

    某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。

    生效时间

    报警规则的生效时间。报警规则只在生效时间内才会检查监控数据是否需要报警。

    报警回调

    公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用阈值报警回调

    报警联系组

    发送报警的联系人组。

    应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。

    关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系人组

  6. 单击确定

查看报警规则

  1. 登录云监控控制台

  2. 在左侧导航栏,选择云资源监控 > Kubernetes容器监控

  3. 容器监控页面,单击目标集群对应操作列的报警规则

  4. 报警规则页面,单击目标报警规则对应操作列的详情报警历史

    查看报警规则的详细信息、报警历史和故障资源。

修改报警规则

  1. 登录云监控控制台

  2. 在左侧导航栏,选择云资源监控 > Kubernetes容器监控

  3. 容器监控页面,单击目标集群对应操作列的报警规则

  4. 报警规则页面,单击目标报警规则对应操作列的修改

  5. 修改报警规则面板,修改报警规则相关参数。

  6. 单击确定

删除报警规则

  1. 登录云监控控制台

  2. 在左侧导航栏,选择云资源监控 > Kubernetes容器监控

  3. 容器监控页面,单击目标集群对应操作列的报警规则

  4. 报警规则页面,先单击目标报警规则对应操作列的image图标,再单击删除

  5. 删除报警确认对话框,单击确认

禁用报警规则

说明

创建的报警规则默认处于正常状态。

  1. 登录云监控控制台

  2. 在左侧导航栏,选择云资源监控 > Kubernetes容器监控

  3. 容器监控页面,单击目标集群对应操作列的报警规则

  4. 报警规则页面,先单击目标报警规则对应操作列的image图标,再单击禁用

  5. 禁用报警规则确认对话框,单击确认

启用报警规则

当报警规则状态为已禁用时,您可以对其执行启用操作。

  1. 登录云监控控制台

  2. 在左侧导航栏,选择云资源监控 > Kubernetes容器监控

  3. 容器监控页面,单击目标集群对应操作列的报警规则

  4. 报警规则页面,先单击目标报警规则对应操作列的image图标,再单击启用

  5. 启用报警规则确认对话框,单击确认