为监控任务创建报警可在满足报警条件时通过邮件、短信、钉钉等渠道实时报警,主动帮助您发现异常。本文将分别以一个实例介绍创建应用监控报警、前端监控报警、自定义监控报警和Prometheus监控报警的方法。

前提条件

确保您已成功创建一个监控任务和管理联系人分组,请参见以下文档:

创建应用监控报警

若需为应用监控任务创建一个JVM-GC次数同比报警,具体操作步骤如下:

  1. 登录ARMS控制台,在左侧导航栏中选择报警管理 > 报警策略管理
  2. 报警规则和历史页面的右上角单击创建报警 > 应用监控报警

  3. 在弹出的创建报警对话框中输入所有必填信息,完成后单击保存

    根据页面提示配置如下参数:

    创建报警
    1. 填写报警名称,例如:JVM-GC次数同比报警。
    2. 应用站点栏选择您已创建的监控任务。
    3. 类型栏选择监控指标的类型,例如:JVM监控。
    4. 设置维度为遍历。
    5. 设置报警规则。
      1. 勾选同时满足下述规则
      2. 编辑报警规则,例如:N = 5时JVM_FullGC累计次数的平均值与上小时同比上升100% 时则报警。
        说明 若需设置多条报警规则,单击报警规则右侧的加号(+),即可编辑第二条报警规则。
    6. 勾选通知方式。例如:勾选邮件。
    7. 设置通知对象。在全部联系组框中单击联系人分组的名称,该联系人分组出现在已选联系组框中,则设置成功。

创建前端监控报警

若需为前端监控任务创建一个页面指标JS错误率和JS错误数报警,具体操作步骤如下:

  1. 在控制台左侧导航栏中选择报警管理 > 报警策略管理

  2. 报警规则和历史页面的右上角单击创建报警 > 前端监控报警

  3. 在弹出的创建报警对话框中输入所有必填信息,完成后单击保存

    根据页面提示配置如下参数:

    创建前端报警
    1. 填写报警名称,例如:页面指标报警。
    2. 应用站点栏选择您已创建的监控任务。
    3. 类型栏选择监控指标的类型,例如:页面指标。
    4. 设置维度为遍历。
    5. 设置报警规则。
      1. 勾选同时满足下述规则
      2. 编辑报警规则,例如:N = 10时JS错误率的平均值大于等于20时则报警。
      3. 单击报警规则右侧的加号(+),编辑第二条报警规则,例如:N = 10时JS错误数的总和大于等于20时则报警。
    6. 勾选通知方式,例如:勾选短信和邮件。
    7. 设置通知对象。在全部联系组中单击联系人分组的名称,该联系人分组出现在已选联系组中,则设置成功。

创建自定义监控报警

若需为自定义监控任务创建一个用户接入报警,具体操作步骤如下:

  1. 在控制台左侧导航栏中选择报警管理 > 报警策略管理

  2. 报警规则和历史页面的右上角单击创建报警 > 自定义监控报警

  3. 创建报警对话框中输入所有必填信息,完成后单击保存

    根据页面提示配置如下参数:

    创建自定义监控报警
    1. 填写报警名称,例如:用户接入通知。
    2. 选择类型为基于已有下钻数据集创建报警
    3. 定义报警变量。为变量a选择一个数据集,设置下钻维度为遍历。
      说明 若您想定义多个报警变量,您可以单击报警变量定义项右侧的加号(+),在弹出的编辑框中定义变量b
    4. 设置报警规则。
      1. 勾选同时满足下述规则
      2. 编辑报警规则,例如:N = 1时用户创建Agent数的平均值大于等于0时则报警。
        说明 您的报警规则中还可以包含简单复合指标:例如N = 1时,(数据集A / 数据集B )的平均值大于等于5则报警。
    5. 勾选通知方式,例如:勾选邮件。
    6. 设置通知对象。在全部联系组中单击联系人分组的名称,该联系人分组出现在已选联系组中,即设置成功。

创建Prometheus监控报警

若需为Prometheus监控任务创建一个网络接收压力报警,具体操作步骤如下:

  1. 在控制台左侧导航栏中选择报警管理 > 报警策略管理

  2. 报警规则和历史页面的右上角单击创建报警 > Prometheus

  3. 创建报警对话框中输入所有必填信息,完成后单击保存

    根据页面提示配置如下参数:

    创建Prometheus监控报警
    1. 填写报警名称,例如:网络接收压力报警。
    2. 选择要创建报警的Prometheus监控对应的集群
    3. 选择类型grafana
    4. 选择要监控的具体大盘图表
    5. 设置报警规则。
      1. 勾选同时满足下述规则
      2. 编辑报警规则,例如:N = 5时网络接收数据字节(MB)的平均值大于等于3时则报警。
        说明 一个Grafana图表中可能有A、B、C三条曲线数据,您可设置监控其中的一条线。
      3. PromQL输入框中编辑或重新输入PromQL语句。
        注意 PromQL语句中包含的$符号会导致报错,您需要删除包含$符号的语句中=左右两边的参数及=。例如:将sum (rate (container_network_receive_bytes_total{instance=~"^$HostIp.*"}[1m]))修改为sum (rate (container_network_receive_bytes_total[1m]))
    6. 勾选通知方式,例如:勾选短信。
    7. 设置通知对象。在全部联系组中单击联系人分组的名称,该联系人分组出现在已选联系组中,即设置成功。