通过设置报警通知策略,您可以制定针对特定监控对象的报警规则。当规则被触发时,系统会以您指定的报警方式向处理人发送报警信息,以提醒处理人采取必要的问题解决措施。

前提条件

操作步骤

  1. 登录Prometheus控制台
  2. 在左侧导航栏中选择通知策略
  3. 通知策略列表区域单击新增策略
  4. 在右侧区域第一行文本框中输入通知策略名称。
  5. 分派规则区域,设置分派条件,您可以自定义或选择已有的标签。例如:alertname等于PodRestart。

    已有的标签包括以下三种:

    • 报警规则表达式指标中携带的标签。
    • 通过报警规则创建的标签。
    • ARMS系统自带的默认标签,默认标签说明如下。
      标签 说明
      alertname 告警名称,格式为:告警名称_集群名称。
      _aliyun_arms_alert_level 告警等级。
      _aliyun_arms_alert_type 告警类型。
      _aliyun_arms_alert_rule_id 告警规则对应的ID。
      _aliyun_arms_region_id 地域ID。
      _aliyun_arms_userid 用户ID。
      _aliyun_arms_involvedObject_type 关联对象子类型,如ManagedKubernetes,ServerlessKubernetes。
      _aliyun_arms_involvedObject_kind 关联对象分类,如app,cluster。
      _aliyun_arms_involvedObject_id 关联对象ID。
      _aliyun_arms_involvedObject_name 关联对象名称。
    说明
    • 如果需同时满足多个分派条件才报警,则单击条件编辑第二条分派条件。
    • 如果需满足任意一个分派条件就报警,则单击添加规则编辑第二条分派条件。
    Assignment rules
  6. 事件处理区域,设置以下参数。
    Dispatch-event handling
    参数 说明
    处理方式
    • 生成告警:将监测到的告警发送给联系人。
    • 不告警(丢弃事件):监测到告警后不发送给联系人。
    说明 如果同时设置了两个相同的分派策略且处理方式分别设置为生成告警不告警(丢弃事件),则不告警(丢弃事件)的优先级高于生成告警,即不会给联系人发送告警信息。
    高级配置
    事件分组
    • 不分组:所有告警会以一条信息发送给处理人。
    • 指定相同字段内容的事件分到一个组:设置分组字段,相同字段的告警内容会分别通过独立信息发送给处理人。
    等待时长
    • 分组等待时间:收到第一个告警后会等待设置的时间,等待分组时间后收到的所有告警会以一条信息发送给处理人。
    • 分组间隔时间:在重复告警静默时间内,如果有新告警产生,等待设置的时间后就会直接发送新的告警信息。
    • 重复告警静默时间:所有告警会以设置的时间间隔循环发送告警信息直至告警消失。
    告警自动恢复 设置当告警下面全部事件都恢复时,是否自动恢复告警。当告警恢复时,将会发送通知给处理人。
  7. 分派处理人区域,设置通知人通知方式,然后单击新增
    • 通知人支持设置联系人和联系人组。联系人和联系人组的创建方法,请参见创建联系人创建联系人分组
    • 通知方式支持钉钉、邮件、Webhook、短信和电话,可勾选多种方式。若需设置钉钉机器人报警,请参见设置钉钉机器人报警
      说明 微信

相关操作

分派策略新建完成后会在告警分派列表中显示。

  • 单击分派策略名称右侧的更多图标,可以停用复制删除该分派策略。
  • 单击目标分派策略,选择右侧页面右上角的图标,可以编辑、刷新、复制和删除该分派策略。