分组评估是告警监控规则中的一个参数。当告警监控系统对查询和分析结果进行计算时,可基于特定字段进行分组,每个分组单独评估触发条件并触发告警。即您可以使用一条告警监控规则同时监控多个目标,并对每个分组进行独立的告警管理和事务管理。

示例一:分组监控时序数据

例如您将多个服务器的指标数据存储在一个时序库中,但希望每个服务器的CPU使用率(cpu_util)超过95%时,日志服务可以分开发送每个服务器的告警信息。针对此需求,您可以在创建告警监控规则时设置分组评估。时序数据
具体配置如下:
  • 查询统计* | select promql_query_range('cpu_util') from metrics limit 1000

    该查询和分析语句用于统计CPU的使用率。

  • 分组评估标签自动

    时序数据的查询和分析结果支持自动分组。

  • 触发条件有数据匹配value > 95

    当查询和分析结果中存在value的值大于95时,触发告警。

  • 添加标注:配置告警事件的标题和描述等标注信息,您可以在标注信息中引用字段变量(例如${host})。更多信息,请参见标签和标注
分组监控时序数据

示例二:分组监控日志

例如您在监控OSS访问日志时,希望每分钟发生500错误超过1000次的Bucket可以分开告警。针对此需求,您可以在创建告警监控规则时设置分组评估。

具体配置如下:
  • 查询统计http_status=500 | select bucket,count(1) as pv group by bucket having pv >1000 order by pv desc

    该查询和分析语句用于统计发生500错误超过1000次的Bucket。

  • 分组评估标签自定义bucket

    查询和分析结果将根据bucket进行分组。

  • 触发条件有数据

    当查询和分析结果中存在数据时触发告警。

  • 告警严重度有数据匹配pv > 3000严重度:高默认严重度:中
    • 当查询和分析结果中pv的值大于3000时,触发高级别的告警。
    • 当查询和分析结果中pv的值为(1000,3000]时,触发中级别的告警。
  • 添加标注:配置告警事件的标题和描述等标注信息,您可以在标注信息中引用字段变量(例如${host})。更多信息,请参见标签和标注
分组监控日志