通过设置通知策略,您可以制定针对告警事件的分派条件。当分派条件被触发时,系统会以您指定的通知方式向处理人发送告警信息,以提醒处理人采取必要的问题解决措施。
前提条件
创建联系人,具体操作,请参见创建联系人。
新建通知策略
登录Prometheus控制台,在左侧导航栏选择 。
在通知策略页面单击新建通知策略。
在新建通知策略页面设置通知策略名称。
在匹配规则区域设置告警事件的匹配规则。
重要静默策略优先于通知策略,即已被静默策略匹配到的告警事件将会被静默,无法再进行通知策略的事件匹配。创建静默策略的操作,请参见静默策略。
选择数据来源。
指定来源:通知策略会针对指定来源(集成)的告警事件进行匹配规则过滤并发送通知。
无预设来源:通知策略会针对所有告警事件进行匹配规则过滤并发送通知。
设置匹配规则表达式,您可以自定义标签或选择已有的标签。
已有的标签包括:
告警规则表达式指标中携带的标签。可观测监控 Prometheus 版告警规则创建标签的操作,请参见Prometheus告警规则。
ARMS系统自带的默认标签,默认标签说明如下。
分类
标签
说明
常用字段
alertname
告警名称。
clustername
集群名称。
severity
告警等级:
P1
P2
P3
P4
默认
namespace
命名空间。
pod_name
系统预置字段
_aliyun_arms_integration_name
集成名称,ARMS默认上报的告警集成名称为ARMS-DEFAULT。
_aliyun_arms_involvedObject_id
告警对象ID。
_aliyun_arms_involvedObject_name
告警对象名称。
_aliyun_arms_region_id
地域ID。
_aliyun_arms_alert_rule_id
告警规则ID。
_aliyun_arms_alert_type
告警规则类型:
101:Prometheus告警
5:应用监控告警
4:前端监控告警
说明如果需同时满足多个匹配规则才告警,则单击添加条件编辑第二条匹配规则条件。
如果需满足任意一个匹配告警事件规则就告警,则单击添加规则编辑第二条匹配规则。
单击下一步。
在事件分组区域,设置告警事件是否需要分组,然后单击下一步。
不需要分组:所有告警事件会以一条告警信息发送给处理人。
设置分组字段:字段内容相同的告警事件会汇总到同一告警发送通知。
在通知对象区域,设置以下参数。
单击+添加通知对象选择通知对象。
通知对象类型:
联系人:选择具体联系人后还需选择使用电话、短信或邮件的通知方式。
联系人组:选择具体联系人组后还需选择使用电话、短信或邮件的通知方式。
排班:选择具体排班后还需选择使用电话、短信或邮件的通知方式。
钉钉/飞书/企微:通过钉钉、飞书或企业微信发送告警通知。
通用Webhook:通过Webhook发送告警通知。
选择告警恢复后是否发送恢复通知。
发送恢复通知:当告警下面全部事件都恢复时,告警状态是否自动恢复为已解决。当告警恢复时,系统将会发送通知给告警处理人。
设置通知模板,更多信息,请参见配置通知模板和Webhook模板。
设置通知时段,告警会在设置的通知时段内发送告警通知。
可选:选择告警需要推送到的工单系统。集成工单系统的操作,请参见通知集成。
单击下一步。
在重复/升级/恢复策略区域,设置告警是否需要重复通知、使用升级策略或开启手动恢复。然后单击下一步。
不需要升级策略,告警未恢复状态下只发送一次。
重复通知:设置重复频率。当告警未恢复时,告警会以设置的重复频率循环发送告警信息直至告警恢复。
升级策略:选择升级策略,告警未恢复状态下,告警通知将会根据升级策略发送通知给其他通知对象。
手动恢复:如果开启手动恢复,当告警事件在告警集成中设置的自动恢复时间内都没有再触发,告警不会自动恢复,必须人工干预调整状态。
在行动集成区域,设置告警是否开启行动集成自动执行。
如果开启行动集成自动执行,告警发生时将根据设定的时机自动化执行指定的行动集成,您需要选择告警触发和恢复时的行动集成。
设置完成后,单击保存。
管理通知策略
通知策略新建完成后会显示在通知策略页面中,您可以在通知策略页面执行以下操作:
编辑通知策略:单击通知策略名称或右侧操作列的编辑,修改通知策略后单击保存。
启用或停用通知策略:在通知策略右侧状态列打开或关闭状态开关。
删除通知策略:单击通知策略右侧操作列的删除,在弹出的对话框中单击确认。
复制并生成一个相同的通知策略:单击通知策略右侧操作列的复制。