可观测链路OpenTelemetry中的告警管理静默策略能够有效收敛告警,从而减少告警风暴的发生。通过设置静默策略,您可以制定告警事件的匹配规则。当规则被触发时,相关事件将被静默处理,且不会被通知策略匹配到。
新建静默策略
登录可观测链路 OpenTelemetry 版控制台,在左侧导航栏选择 。
选择静默策略页签,在右侧单击新建静默策略,在新建静默策略页面设置静默策略名称。
在静默事件匹配规则区域设置静默事件的匹配规则。
静默策略优先于通知策略,即已被静默策略匹配到的告警事件将会被静默,无法再进行通知策略的事件匹配。创建通知策略的操作,请参见通知策略。
选择数据来源。
指定来源:静默策略会针对指定来源(集成)的告警事件进行匹配规则过滤。
无预设来源:静默策略会针对所有告警事件进行匹配规则过滤。
设置匹配规则表达式,您可以自定义标签或选择已有的标签。
已有的标签包括:
告警规则表达式指标中携带的标签。可观测监控 Prometheus 版告警规则创建标签的操作,请参见Prometheus告警规则。
ARMS系统自带的默认标签,默认标签说明如下。
分类
标签
说明
分类
标签
说明
常用字段
alertname
告警名称。
clustername
集群名称。
severity
告警等级:
P1
P2
P3
P4
默认
namespace
命名空间。
pod_name
系统预置字段
_aliyun_arms_integration_name
集成名称,ARMS默认上报的告警集成名称为ARMS-DEFAULT。
_aliyun_arms_involvedObject_id
告警对象ID。
_aliyun_arms_involvedObject_name
告警对象名称。
_aliyun_arms_region_id
地域ID。
_aliyun_arms_alert_rule_id
告警规则ID。
_aliyun_arms_alert_type
告警规则类型:
101:Prometheus告警
5:应用监控告警
4:前端监控告警
如果需同时满足多个匹配规则才告警,则单击添加条件编辑第二条匹配规则条件。
如果需满足任意一个匹配告警事件规则就告警,则单击添加规则编辑第二条匹配规则。
设置静默规则生效时间。
持续生效
循环生效:选择每天或每周循环,然后单击添加,设置静默规则生效时间段。
自定义时间段:单击添加,设置静默规则生效时间段。
设置完成后,单击保存。
管理静默策略
您可以在静默策略页面执行以下操作:
编辑静默策略:单击静默策略名称或右侧操作列的编辑,修改静默策略后单击保存。
启用或停用静默策略:在静默策略右侧状态列打开或关闭状态开关。
删除静默策略:单击静默策略右侧操作列的删除,在弹出的对话框中单击确认。
复制并生成一个相同的静默策略:单击静默策略右侧操作列的复制。
- 本页导读 (1)
- 新建静默策略
- 管理静默策略