MSE提供了应用监控告警功能,可在满足告警条件时通过邮件、短信、钉钉等渠道实时告警,帮助您主动发现异常。

前提条件

创建联系人分组

背景信息

报警控件本质是数据集的数据展示方式,所以在创建报警控件的同时,会创建一个数据集来存储报警控件的底层数据。

说明 新建报警大约在10分钟内生效,报警判断会存在1分钟~3分钟的延时。

操作步骤

  1. 登录MSE管理控制台
  2. 在左侧导航栏选择注册配置中心 > 告警管理 > 告警管理策略
  3. MSE告警列表页面右上方单击创建MSE告警规则
  4. 创建MSE告警规则页面配置告警相关参数,完成后单击保存
    创建MSE告警规则
    表 1. 告警参数说明
    参数 描述
    告警名称 填写告警规则名称。
    MSE集群 选择集群。集群名称后的()里显示该集群的注册配置中心类型,目前仅支持Nacos和ZooKeeper。
    告警分组 选择告警指标的分组,目前支持Nacos和ZooKeeper。
    告警指标 选择告警指标,不同告警分组所支持的告警指标也不同,请根据实际需求进行选择。
    告警条件 设置触发告警的条件,例如:当服务数大于100时,发送告警。
    筛选条件 默认无筛选,无需设置。
    数据概览 当设置完告警条件后,在空白处单击鼠标左键,系统会自动弹出当前告警规则的预览数据。您可自定义事件周期进行筛选,当鼠标悬浮在图表上,可显示该时刻下的数据。
    持续时间 设置满足告警条件的持续时间,当满足告警条件的时间达到设置的时间时,将会触发告警。
    告警等级 设置告警的等级,默认告警等级为默认,告警严重程度从默认、P4、P3、P2、P1逐级上升。
    告警内容 设置触发该告警时,所显示的告警内容。您可以使用Go template语法在告警内容中自定义告警参数变量,例如:
    告警集群的ID:{{$label.service_cluster_id}}
    告警的集群节点:{{$label.kubernetes_pod_name}}
    设置的阈值:{{$labels.metrics_params_value}}
    触发告警的实际值:{{ printf "%.2f" $value }} 

    同时,告警内容也会根据告警指标自动进行调整。

    通知策略 当告警触发时,告警中心会根据配置的通知策略对产生的告警事件进行分派、处理并发送通知。
    高级设置 单击展开图标图标,设置告警规则标签和注释。
    标签 单击创建标签,设置告警规则的标签,设置的标签可用作分派规则的选项。
    注释 单击创建注释,设置message,设置{{变量名}}告警信息。设置完成后的格式为:message:{{$labels.pod_name}}重启}}告警信息,例如:message:{{$labels.pod_name}}重启

后续操作

您可以在管理告警规则系统中查询和删除报警记录。