您可以使用无数据告警功能,用于避免采集过程中数据丢失无感知问题。
例如您创建了一个告警监控规则用于监控各个主机的CPU指标,并希望发生如下情况时,收到告警通知。
- CPU使用率超过95%。
- 查询和分析结果中无数据。
具体配置如下所示:
- 查询统计:
* | select promql_query_range('cpu_util') from metrics limit 1000
该查询和分析语句用于统计CPU的使用率。
- 触发条件:有数据匹配,value>95,严重度:中
当查询和分析结果中存在value的值大于95时,触发中级别的告警。
- 连续触发阈值:当累计触发的告警次数达到该值时,产生一条告警。
- 无数据告警:打开无数据告警开关,并设置严重度和标注信息。
开启无数据告警功能后,如果查询和分析结果中无数据的次数超过连续触发阈值,将触发告警。
无数据告警具备独立的告警严重度和标注信息。
