为监控任务创建报警可在满足报警条件时通过邮件、短信、钉钉等渠道实时报警,主动帮助您发现异常。本文将分别以一个实例介绍创建应用监控报警、前端监控报警、自定义监控报警和Prometheus监控报警的方法。
前提条件
确保您已成功创建一个监控任务和管理联系人分组,请参见以下文档:
创建应用监控报警
若需为应用监控任务创建一个JVM-GC次数同比报警,具体操作步骤如下:
- 登录ARMS控制台,在左侧导航栏中选择 。
- 在报警规则和历史页面的右上角单击 。
- 在弹出的创建报警对话框中输入所有必填信息,完成后单击保存。
根据页面提示配置如下参数:
- 填写报警名称,例如:JVM-GC次数同比报警。
- 在应用站点栏选择您已创建的监控任务。
- 在类型栏选择监控指标的类型,例如:JVM监控。
- 设置维度为遍历。
- 设置报警规则。
- 选择同时满足下述规则。
- 编辑报警规则,例如:N=5时JVM_FullGC累计次数的平均值与上小时同比上升100% 时则报警。
说明 若需设置多条报警规则,单击报警规则右侧的加号(+),即可编辑第二条报警规则。
- 选择通知方式。例如:选择邮件。
- 设置通知对象。在全部联系组框中单击联系人分组的名称,该联系人分组出现在已选联系组框中,则设置成功。
创建前端监控报警
若需为前端监控任务创建一个页面指标JS错误率和JS错误数报警,具体操作步骤如下:
-
在控制台左侧导航栏中选择
。 -
在报警规则和历史页面的右上角单击 。
-
在弹出的创建报警对话框中输入所有必填信息,完成后单击保存。
根据页面提示配置如下参数:
- 填写报警名称,例如:页面指标报警。
- 在应用站点栏选择您已创建的监控任务。
- 在类型栏选择监控指标的类型,例如:页面指标。
- 设置维度为遍历。
- 设置报警规则。
- 选择同时满足下述规则。
- 编辑报警规则,例如:N=10时JS错误率的平均值大于等于20时则报警。
- 单击报警规则右侧的加号(+),编辑第二条报警规则,例如:N=10时JS错误数的总和大于等于20时则报警。
- 选择通知方式,例如:选择短信和邮件。
- 设置通知对象。在全部联系组中单击联系人分组的名称,该联系人分组出现在已选联系组中,则设置成功。
创建自定义监控报警
若需为自定义监控任务创建一个用户接入报警,具体操作步骤如下:
-
在控制台左侧导航栏中选择
。 -
在报警规则和历史页面的右上角单击 。
-
在创建报警对话框中输入所有必填信息,完成后单击保存。
根据页面提示配置如下参数:
- 填写报警名称,例如:用户接入通知。
- 选择类型为基于已有下钻数据集创建报警。
- 定义报警变量。为变量a选择一个数据集,设置下钻维度为遍历。
说明 若您想定义多个报警变量,您可以单击报警变量定义项右侧的加号(+),在弹出的编辑框中定义变量b。
- 设置报警规则。
- 选择同时满足下述规则。
- 编辑报警规则,例如:N=1时用户创建Agent数的平均值大于等于0时则报警。
说明 您的报警规则中还可以包含简单复合指标:例如N=1时,(数据集A/数据集B)的平均值大于等于5则报警。
- 选择通知方式,例如:选择邮件。
- 设置通知对象。在全部联系组中单击联系人分组的名称,该联系人分组出现在已选联系组中,即设置成功。
创建Prometheus监控报警
若需为Prometheus监控任务创建一个网络接收压力报警,具体操作步骤如下:
-
在控制台左侧导航栏中选择
。 -
在报警规则和历史页面的右上角单击 。
-
在创建报警对话框中输入所有必填信息,完成后单击保存。
根据页面提示配置如下参数:
- 填写报警名称,例如:网络接收压力报警。
- 选择要创建报警的Prometheus监控对应的集群。
- 选择类型为grafana。
- 选择要监控的具体大盘和图表。
- 设置报警规则。
- 选择同时满足下述规则。
- 编辑报警规则,例如:N=5时网络接收数据字节(MB)的平均值大于等于3时则报警。
说明 一个Grafana图表中可能有A、B、C三条曲线数据,您可设置监控其中的一条线。
- 在PromQL输入框中编辑或重新输入PromQL语句。
注意 PromQL语句中包含的
$
符号会导致报错,您需要删除包含$
符号的语句中=
左右两边的参数及=
。例如:将sum (rate (container_network_receive_bytes_total{instance=~"^$HostIp.*"}[1m]))
修改为sum (rate (container_network_receive_bytes_total[1m]))
。
- 选择通知方式,例如:选择短信。
- 设置通知对象。在全部联系组中单击联系人分组的名称,该联系人分组出现在已选联系组中,即设置成功。
在文档使用中是否遇到以下问题
更多建议
匿名提交