通知策略

通过设置通知策略,您可以制定针对告警事件的分派条件。当分派条件被触发时,系统会以您指定的通知方式向处理人发送告警信息,以提醒处理人采取必要的问题解决措施。

前提条件

创建联系人,具体操作,请参见创建联系人

新建通知策略

  1. 登录Prometheus控制台,在左侧导航栏选择告警管理 > 通知策略

  2. 通知策略页面单击新建通知策略

  3. 新建通知策略页面设置通知策略名称。

  4. 匹配规则区域设置告警事件的匹配规则。

    重要

    静默策略优先于通知策略,即已被静默策略匹配到的告警事件将会被静默,无法再进行通知策略的事件匹配。创建静默策略的操作,请参见静默策略

    1. 选择数据来源。

      • 指定来源:通知策略会针对指定来源(集成)的告警事件进行匹配规则过滤并发送通知。

      • 无预设来源:通知策略会针对所有告警事件进行匹配规则过滤并发送通知。

    2. 设置匹配规则表达式,您可以自定义标签或选择已有的标签。

      已有的标签包括:

      • 告警规则表达式指标中携带的标签。可观测监控 Prometheus 版告警规则创建标签的操作,请参见Prometheus告警规则

      • ARMS系统自带的默认标签,默认标签说明如下。

        分类

        标签

        说明

        常用字段

        alertname

        告警名称。

        clustername

        集群名称。

        severity

        告警等级:

        • P1

        • P2

        • P3

        • P4

        • 默认

        namespace

        命名空间

        pod_name

        Pod名称

        系统预置字段

        _aliyun_arms_integration_name

        集成名称,ARMS默认上报的告警集成名称为ARMS-DEFAULT。

        _aliyun_arms_involvedObject_id

        告警对象ID。

        _aliyun_arms_involvedObject_name

        告警对象名称。

        _aliyun_arms_region_id

        地域ID。

        _aliyun_arms_alert_rule_id

        告警规则ID。

        _aliyun_arms_alert_type

        告警规则类型:

        • 101:Prometheus告警

        • 5:应用监控告警

        • 4:前端监控告警

      说明
      • 如果需同时满足多个匹配规则才告警,则单击添加条件编辑第二条匹配规则条件。

      • 如果需满足任意一个匹配告警事件规则就告警,则单击添加规则编辑第二条匹配规则。

    3. 单击下一步

  5. 事件分组区域,设置告警事件是否需要分组,然后单击下一步

    • 不需要分组:所有告警事件会以一条告警信息发送给处理人。

    • 设置分组字段:字段内容相同的告警事件会汇总到同一告警发送通知。

  6. 通知对象区域,设置以下参数。

    1. 单击+添加通知对象选择通知对象。

      通知对象类型:通知策略-当告警生成时

      • 联系人:选择具体联系人后还需选择使用电话、短信或邮件的通知方式。

      • 联系人组:选择具体联系人组后还需选择使用电话、短信或邮件的通知方式。

      • 排班:选择具体排班后还需选择使用电话、短信或邮件的通知方式。

      • 钉钉/飞书/企微:通过钉钉、飞书或企业微信发送告警通知。

      • 通用Webhook:通过Webhook发送告警通知。

    2. 选择告警恢复后是否发送恢复通知。

      发送恢复通知:当告警下面全部事件都恢复时,告警状态是否自动恢复为已解决。当告警恢复时,系统将会发送通知给告警处理人。

    3. 设置通知模板,更多信息,请参见配置通知模板和Webhook模板

    4. 设置通知时段,告警会在设置的通知时段内发送告警通知。

    5. 可选:选择告警需要推送到的工单系统。集成工单系统的操作,请参见通知集成

    6. 单击下一步

  7. 重复/升级/恢复策略区域,设置告警是否需要重复通知、使用升级策略或开启手动恢复。然后单击下一步

    • 不需要升级策略,告警未恢复状态下只发送一次。

    • 重复通知:设置重复频率。当告警未恢复时,告警会以设置的重复频率循环发送告警信息直至告警恢复。

    • 升级策略:选择升级策略,告警未恢复状态下,告警通知将会根据升级策略发送通知给其他通知对象。

    • 手动恢复:如果开启手动恢复,当告警事件在告警集成中设置的自动恢复时间内都没有再触发,告警不会自动恢复,必须人工干预调整状态。

  8. 行动集成区域,设置告警是否开启行动集成自动执行。

    如果开启行动集成自动执行,告警发生时将根据设定的时机自动化执行指定的行动集成,您需要选择告警触发和恢复时的行动集成。

  9. 设置完成后,单击保存

管理通知策略

通知策略新建完成后会显示在通知策略页面中,您可以在通知策略页面执行以下操作:

  • 编辑通知策略:单击通知策略名称或右侧操作列的编辑,修改通知策略后单击保存

  • 启用或停用通知策略:在通知策略右侧状态列打开或关闭状态开关。

  • 删除通知策略:单击通知策略右侧操作列的删除,在弹出的对话框中单击确认

  • 复制并生成一个相同的通知策略:单击通知策略右侧操作列的复制