通过设置通知策略,您可以制定针对告警事件的分派规则。当规则被触发时,系统会以您指定的通知方式向处理人发送告警信息,以提醒处理人采取必要的问题解决措施。
前提条件
创建联系人,具体操作,请参见创建联系人。
新建通知策略
登录EDAS控制台。
在左侧导航栏,单击 ,在顶部菜单栏选择地域并在页面上方选择所属微服务空间,在集群类型下拉列表,选择K8s集群,然后在页面单击具体的应用名称。
在左侧导航栏中选择 。
在通知策略页面右上角单击创建通知策略。
在右侧区域顶部文本框中输入通知策略名称。
在分派规则区域的进行以下操作。
选择告警过滤来源或不过滤来源。
指定过滤来源:通知策略会针对指定来源的告警事件进行分派规则过滤并发送通知。
不过滤来源:通知策略会针对所有告警事件进行分派规则过滤并发送通知。
设置分派条件表达式,您可以自定义标签或选择已有的标签。例如:alertname等于PodRestart。
已有的标签包括以下三种:
告警规则表达式指标中携带的标签。
Prometheus监控通过告警规则创建的标签。
EDAS系统自带的默认标签,默认标签说明如下。
标签
说明
alertname
告警名称,格式为:告警名称_集群名称。
_aliyun_arms_alert_level
告警等级。
_aliyun_arms_alert_type
告警类型。
_aliyun_arms_alert_rule_id
告警规则对应的ID。
_aliyun_arms_region_id
地域ID。
_aliyun_arms_userid
用户ID。
_aliyun_arms_involvedObject_type
关联对象子类型,如ManagedKubernetes,ServerlessKubernetes。
_aliyun_arms_involvedObject_kind
关联对象分类,如app,cluster。
_aliyun_arms_involvedObject_id
关联对象ID。
_aliyun_arms_involvedObject_name
关联对象名称。
说明如果需同时满足多个分派条件才告警,则单击+条件编辑第二条分派条件。
如果需满足任意一个分派条件就告警,则单击+添加规则编辑第二条分派条件。
在事件处理区域,设置以下参数。
参数
说明
处理方式
生成告警:将监测到的告警发送给联系人。
不告警(丢弃事件):监测到告警后不发送给联系人。
说明如果同时设置了两个相同的通知策略且处理方式分别设置为生成告警和不告警(丢弃事件),则不告警(丢弃事件)的优先级高于生成告警,即不会给联系人发送告警信息。
高级配置
事件分组
不分组:所有告警会以一条信息发送给处理人。
指定相同字段内容的事件分到一个组:设置分组字段,相同字段的告警内容会分别通过独立信息发送给处理人。
告警自动恢复
当告警下面全部事件都恢复时,告警状态是否自动恢复为已解决。当告警恢复时,系统将会发送通知给处理人。
在当告警生成时区域,设置以下参数。
参数
说明
通知人
通知人支持设置联系人、联系人组和钉群。联系人创建方法,请参见创建联系人。
通知方式
通知方式支持钉钉、邮件、WebHook、短信和电话,可以同时选择多种方式。
说明未验证手机号的联系人无法使用电话通知方式。验证手机号的操作,请参见验证手机号。
单击通知模板,可以在通知模板对话框中设置邮件、短信和电话的通知信息格式。
通知时段
告警会在设置的通知时段内重复发送告警通知。
升级通知方式
对于长期未解决的告警可以选择重复通知或升级通知来提醒联系人及时解决。
重复通知:选择重复通知后,需要设置告警发送频率。所有告警会在指定通知时段内以设置的告警发送频率循环发送告警信息直至告警恢复。
升级策略:选择升级策略后,需要选择已有的升级策略或添加一个新的升级策略。具体操作,请参见升级策略。
说明单击详情,可以查看当前选中的升级策略的详细信息。
工单系统
选择告警需要推送到的工单系统。工单系统的集成,请参见通过Jira账号信息集成Jira工单系统。
设置完成后,单击右上角的图标。
管理通知策略
通知策略新建完成后会在通知策略列表中显示,您可以在通知策略列表中执行以下操作:
单击通知策略名称右侧的更多图标,选择编辑、停用、启用、复制或删除可以管理该通知策略。
单击目标通知策略,在右侧页面右上角选择相应的图标,可以编辑、刷新、复制和删除该通知策略。