在密集监控场景中,您可以开启恢复通知功能,便于及时感知异常恢复情况。即监控对象恢复正常时,日志服务将以告警通知形式发送一条恢复通知。

例如您创建了一个告警监控规则,用于监控各个主机的CPU指标,当CPU使用率超过95%时触发告警,主机CPU使用率下降为正常值(低于等于95%)后发送一条恢复通知。具体配置如下图所示,更多参数说明,请参见创建日志告警监控规则

具体配置如下:

恢复通知
  • 查询统计* | select promql_query_range('cpu_util') from metrics limit 1000

    该查询和分析语句用于统计CPU的使用率。

  • 分组评估标签自动

    时序数据的查询和分析结果支持自动分组。

  • 触发条件有数据匹配value > 95严重度:高

    当查询和分析结果中存在value的值大于95时,触发高级别的告警。

  • 添加标注:配置告警事件的标题和描述等标注信息,您可以在标注信息中引用字段变量(例如${host})。更多信息,请参见标签和标注
  • 恢复通知:打开恢复通知开关。

    恢复通知是特殊的告警通知,其告警状态为恢复,普通告警的状态为触发。当您开启该功能后,如果告警监控系统上次执行检查时查询和分析结果触发了告警,而本次检查时查询和分析结果不满足触发条件,则会发送一条恢复通知。

日志服务以告警通知形式发送恢复通知,恢复通知中将标明告警状态恢复