当您将阿里云产品、线下IDC(Internet Data Center)、其他云厂商产品、Prometheus、本地日志、SLS日志和自定义监控数据接入云监控后,如果需要监控各资源的使用情况并报警,则可以创建报警规则。当资源的监控指标达到报警条件时,云监控自动给您发送报警通知。
前提条件
请确保您已创建指标仓库。具体操作,请参见创建指标仓库。
使用限制
一个阿里云账号最多可以创建20条报警规则。
操作步骤
登录云监控控制台。
在左侧导航栏,选择 。
在指标仓库页面,单击左上角的创建报警。
在创建报警规则面板,设置报警规则相关参数。
参数
说明
规则名称
报警规则的名称。
指标仓库
报警规则作用的指标仓库。
报警表达式
报警规则的主体。当监控指标满足报警条件时,触发报警规则。
标签
报警规则的标签。您可以设置标签键和标签值。
注释
报警规则的注释。您可以设置注释键和注释值。
通道沉默周期
报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。
某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。
例如:当通道沉默周期选择12小时时,如果报警未恢复正常,则间隔12小时后,云监控会再次发送报警通知。
生效时间
报警规则的生效时间。报警规则只在生效时间内才会检查监控指标是否需要报警。
报警联系人组
发送报警的联系人组。
应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。
关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系人组。
报警级别
报警级别和报警通知方式。取值:
紧急(电话+短信+邮件+Webhook)
警告(短信+邮件+Webhook)
普通(邮件+Webhook)
报警连续周期的取值:1、3、5、10、15、30、60、70、90、120和180。1周期等于1分钟。
报警回调
公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。
当您需要测试报警回调地址的连通性时,可以执行以下操作。
单击回调地址正后方的测试。
在WebHook测试面板,您可以通过Webhook返回的状态码和测试结果详情对报警回调地址的连通性进行判断和排查。
说明您还可以设置Webhook的回调模板类型和语言,再次单击测试,获取对应的测试结果详情。
单击关闭。
弹性伸缩
如果您打开弹性伸缩开关,当报警发生时,会触发相应的伸缩规则。您需要设置弹性伸缩的地域、弹性伸缩组和弹性伸缩规则。
日志服务
如果您打开日志服务开关,当报警发生时,会将报警信息写入日志服务。您需要设置日志服务的地域、ProjectName和Logstore。
关于如何创建Project和Logstore,请参见快速入门。
轻量消息队列(原 MNS)— topic
如果您打开轻量消息队列(原 MNS)— topic开关,当报警发生时,会将报警信息写入消息服务的主题。您需要设置消息服务的地域和主题。
关于如何创建主题,请参见创建主题。
函数计算
如果您打开函数计算开关,当报警发生时,会将报警通知发送至函数计算进行格式处理。您需要设置函数计算的地域、服务和函数。
关于如何创建服务和函数,请参见快速创建函数。
无数据处理方法
无监控数据时报警的处理方式。取值:
不做任何处理
发送无数据报警
视为恢复(默认值)
单击确定。
查看创建的报警规则。
在左侧导航栏,选择
。在报警规则页面,产品名称为Prometheus的报警规则为您创建的报警规则。