您可以为容器服务Kubernetes版的集群、节点或容器组(pod)创建报警规则。当符合报警规则时,云监控自动发送报警通知,便于您及时了解容器服务的异常并快速进行处理。本文为您介绍创建、查看、修改、删除、暂停和启用报警规则的操作方法。
前提条件
请您确保已开通容器服务Kubernetes版,且已创建集群。具体操作,请参见首次使用容器服务Kubernetes版。
请您确保容器服务Kubernetes版集群的metrics-server组件已升级到V0.3.8.5及以上版本。具体操作,请参见升级集群至v1.12版本前升级metrics-server组件。
对于2024年04月25日10:00:00以后创建的容器服务Kubernetes版集群,请您确保已手动开启metrics-server组件的云监控功能。具体操作,请参见开启容器服务Kubernetes版集群的云监控功能。
创建报警规则
登录云监控控制台。
在左侧导航栏,选择
。在容器监控页面,单击目标集群对应操作列的报警规则。
在报警规则页面,单击创建报警规则。
在创建报警规则面板,设置报警规则相关参数。
参数
描述
资源范围
报警规则的作用范围。取值:
集群:报警规则作用于目标集群。您需要选择集群名称。
节点:报警规则作用于目标集群的全部节点或指定节点。您需要选择集群及其节点。
容器组(pod):报警规则作用于目标集群的指定命名空间下应用中的全部容器组或指定容器组。您需要先选择集群及其命名空间,再从无状态、有状态、守护进程集、任务或定时任务页签中选择部署应用和容器组(pod)。
说明在容器组页签,您仅需选择容器组(pod)。
规则描述
报警规则的主体。当监控数据满足指定条件时,触发报警规则。
通道沉默周期
报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。
某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。
生效时间
报警规则的生效时间。报警规则只在生效时间内才会检查监控数据是否需要报警。
报警回调
公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用阈值报警回调。
报警联系组
发送报警的联系人组。
应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。
关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系人组。
单击确定。
查看报警规则
登录云监控控制台。
在左侧导航栏,选择
。在容器监控页面,单击目标集群对应操作列的报警规则。
在报警规则页面,单击目标报警规则对应操作列的详情或报警历史。
查看报警规则的详细信息、报警历史和故障资源。
修改报警规则
登录云监控控制台。
在左侧导航栏,选择
。在容器监控页面,单击目标集群对应操作列的报警规则。
在报警规则页面,单击目标报警规则对应操作列的修改。
在修改报警规则面板,修改报警规则相关参数。
单击确定。
删除报警规则
登录云监控控制台。
在左侧导航栏,选择
。在容器监控页面,单击目标集群对应操作列的报警规则。
在报警规则页面,先单击目标报警规则对应操作列的图标,再单击删除。
在删除报警确认对话框,单击确认。
禁用报警规则
创建的报警规则默认处于正常状态。
登录云监控控制台。
在左侧导航栏,选择
。在容器监控页面,单击目标集群对应操作列的报警规则。
在报警规则页面,先单击目标报警规则对应操作列的图标,再单击禁用。
在禁用报警规则确认对话框,单击确认。
启用报警规则
当报警规则状态为已禁用时,您可以对其执行启用操作。
登录云监控控制台。
在左侧导航栏,选择
。在容器监控页面,单击目标集群对应操作列的报警规则。
在报警规则页面,先单击目标报警规则对应操作列的图标,再单击启用。
在启用报警规则确认对话框,单击确认。