针对告警事件,您可以通过设置通知策略,制定对应的匹配条件。当匹配条件被触发时,系统会以您指定的通知方式向处理人发送告警信息。本文介绍如何在SAE控制台为应用配置通知策略。
前提条件
已创建联系人操作步骤
登录SAE控制台。
在左侧导航栏,选择 ,在顶部菜单栏选择地域,然后单击具体应用名称。
- 在左侧导航栏,选择 ,然后在通知策略页面,单击创建通知策略。
- 在右侧编辑区域上方的文本框,输入通知策略名称。
- 在匹配告警事件规则区域,配置以下信息。
选择数据来源。
指定来源:通知策略会针对指定来源(集成)的告警事件进行匹配规则过滤并发送通知。
无预设来源:通知策略会针对所有告警事件进行匹配规则过滤并发送通知。
- 设置匹配规则表达式。您可以自定义标签或选择已有的标签,例如设置alertname等于内存使用率。设置通知策略的更多信息,请参见通知策略最佳实践。
已有的标签类型说明如下。
告警规则表达式指标中携带的标签。可观测监控 Prometheus 版告警规则创建标签的操作,请参见Prometheus告警规则。
- ARMS系统自带的默认标签,默认标签说明如下。展开查看默认标签。
分类 标签 说明 常用字段 alertname 告警名称。 clustername 集群名称。 severity 告警等级。告警严重程度从默认、P4、P3、P2、P1逐级上升。 namespace 命名空间。 pod_name Pod名称。 系统预置字段 _aliyun_arms_integration_name 集成名称,ARMS默认上报的告警集成名称为ARMS-DEFAULT。 _aliyun_arms_involvedObject_id 告警对象ID。 _aliyun_arms_involvedObject_name 告警对象名称。 _aliyun_arms_region_id 地域ID。 _aliyun_arms_alert_rule_id 告警规则ID。 _aliyun_arms_alert_type 告警规则类型: - 101:Prometheus告警
- 5:应用监控告警
- 4:前端监控告警
说明如果需同时满足多个匹配规则才告警,则单击添加条件编辑第二条匹配规则条件。
如果需满足任意一个匹配告警事件规则就告警,则单击添加规则编辑第二条匹配规则。
- 在事件处理区域,配置以下信息。说明 如果您需要调整告警通知频率,可以修改告警规则并配置智能降噪。在左侧导航栏选择配置智能降噪。,在事件列表页面打开智能分析开关。更多信息,请参见
配置项 说明 处理方式 - 压缩:默认选择。将通知策略匹配到的事件进行分组后,相同分组的事件压缩为一条告警。同一条事件可以同时匹配多条通知规则,生产不同的告警。
- 静默:静默通知策略匹配到的事件,不生成告警。事件被静默后,不会再被其他通知策略匹配到。事件优先静默。
规则生效时间段配置 仅当处理方式选择静默时需要设置。 可选类型包括永久生效、循环生效和自定义时间段。
高级配置 仅当处理方式选择压缩时需要设置。 - 事件分组
- 不分组:默认选择。所有告警会以一条信息发送给处理人。
- 指定相同字段内容的事件分到一个组:设置分组字段,相同字段的告警内容会分别通过独立信息发送给处理人。
- 告警自动恢复:默认开启。当全部告警事件都恢复时(即告警事件处理完毕),告警状态是否自动恢复为已解决。当告警恢复时,系统将会发送通知给处理人。
- 在当告警生成时区域,配置以下信息。
配置项 说明 通知人/排班 支持设置联系人、联系人组、钉群和排班表。联系人的创建方法,请参见创建联系人。 通知方式 支持钉钉、邮件、短信、电话和Webhook,可以同时选择多种方式。 - 未验证手机号的联系人无法使用电话通知方式。验证手机号的操作,请参见验证手机号。
- 单击通知模板,可以在通知模板对话框中设置邮件、短信和电话的通知信息格式。
通知时段 告警会在设置的通知时段内重复发送告警通知。 通知升级方式 对于长期未解决的告警,可以选择重复通知或升级通知来提醒联系人及时解决。 - 重复通知:设置告警发送频率。所有告警会在指定通知时段内以设置的告警发送频率循环发送告警信息直至告警恢复。
- 升级通知:告警未恢复状态下,根据升级策略发送通知给其他联系人。单击详情,可以查看当前选中的升级策略的详细信息。创建升级策略的操作,请参见升级策略。
- 不进行重复通知。
工单系统 选择告警需要推送到的工单系统。工单系统的集成,请参见通过Jira账号信息集成Jira工单系统。 - 单击保存。您可以在通知策略左侧的通知策略列表,查看已成功创建的策略。单击通知策略名称右侧的图标,可以按需编辑、启停、复制或删除目标通知策略。
文档内容是否对您有帮助?