创建应用监控告警并发送告警通知

本文通过示例说明创建应用监控告警规则的流程和效果。

前提条件

已接入应用监控,具体操作,请参见应用监控接入概述

背景信息

ARMS应用监控告警支持对采集到的各种应用指标配置告警规则。您可以根据需求和业务场景配置合理的告警规则,即可在应用不符合预期时收到通知,以便及时做出响应。本文以下述场景为例说明如何使用ARMS应用监控告警规则。

示例场景:核心业务请求延时过高或成功率下降。

示例应用名称:user-serviceuser-service应用是部署在阿里云容器服务Kubernetes版集群上面的一个Java应用,且已经成功接入了ARMS应用监控。

user-service应用是公司的核心服务,如果其接口可用性下降将导致严重的后果,因此,当此应用提供的接口调用延时增加或者成功率下降时,运维人员需及时收到通知并且迅速响应。

在此背景下,运维人员需要关注的指标有:

  • 应用提供服务的平均响应时间

  • 应用提供服务的请求成功率

步骤一:验证应用是否成功接入应用监控

执行以下步骤验证user-service应用是否成功接入应用监控。

  1. 登录ARMS控制台
  2. 在左侧导航栏,选择应用监控 > 应用列表
  3. 应用列表中单击user-service应用名称。

    1. 在左侧导航栏单击应用总览

      进入应用总览页面,查看应用总览页面是否有数据。

      应用总览
    2. 在左侧导航栏单击应用详情

      进入应用详情的概览页签,查看概览页签是否有数据。

      应用详情

    如果上面两个页面有数据,说明应用已经成功接入ARMS应用监控;如果上面两个页面都没有任何数据,说明应用没有成功接入,请将应用重新接入应用监控。

    说明

    示例应用是容器服务Kubernetes版集群的Java应用,如果您的应用是其它类型,接入应用监控成功之后的页面显示可能与上图不同,但是只要页面有指标数据就说明已经接入成功。

步骤二:进入创建应用监控告警规则页面

方法一

  1. 登录ARMS控制台
  2. 在左侧导航栏,选择应用监控 > 应用列表
  3. 在顶部菜单栏,选择地域。
  4. 应用列表页面,单击user-service应用名称。

  5. 应用总览页面的应用提供服务区域,单击右上角的告警图标,可以快速跳转到创建应用监控告警规则页面。

    应用提供服务

    通过这种方法进入创建应用监控告警规则页面,可以自动选择告警应用指标类型参数。创建应用监控告警页面01

方法二

  1. 登录ARMS控制台
  2. 在左侧导航栏,选择应用监控 > 应用监控告警规则

  3. 在顶部菜单栏,选择地域。
  4. 告警规则页面右上角,单击创建应用监控告警规则

  5. 创建应用监控告警规则页面,设置告警应用user-service指标类型应用调用类型统计

步骤三:创建告警规则

本示例中需要创建以下两条告警规则,并在告警触发时通过短信,邮件和钉钉群通知联系人:

  • user-service应用提供请求延时过高的告警规则:

    最近3分钟应用依赖服务调用响应时间大于等于500 ms。
  • user-service应用提供请求成功率下降的告警规则:

    最近3分钟应用依赖服务调用错误率小于等于90%。
说明

一般认为接口在短时间内有所波动为正常现象,持续性的异常才需要关注并且响应。所以在添加告警规则时,可以设置当最近3分钟的平均延时都比较高或者请求失败率低于90%的时候才需要告警。您在创建应用监控告警规则时,可以根据需要指定不同的时间和指标计算方法。

  1. 创建应用监控告警规则页面输入告警名称,添加告警条件。

    此处先创建user-service应用提供请求延时过高的告警条件。创建应用监控告警

  2. 设置通知策略。

    • 如果您已经创建过通知策略,则在通知策略区域选择已有的通知策略。

    • 如果您之前没有创建过通知策略,则执行步骤3新建通知策略。新建完通知策略后,在创建应用监控告警规则页面刷新并选择通知策略

  3. 可选:单击通知策略右侧的快速创建通知策略

    在右侧弹出的快速创建通知策略面板中,选择通知对象,并设置其他参数,然后单击确认

    • 如果您已经创建过通知对象,则在通知对象区域选择已有的通知对象。

    • 如果您之前没有创建过通知对象,则执行步骤4新建通知对象。新建完通知对象后,在快速创建通知策略面板刷新并选择通知对象

  4. 可选:单击通知对象右侧的新建通知对象,然后在下拉框单击新建通知对象

    在通知对象页面创建联系人、钉钉、飞书、企业微信等通知对象。

    1. 联系人页签,单击右上角的新建联系人

    2. 新建联系人对话框中输入联系人参数,然后单击确认

    3. 联系人页签,单击右上角的新建联系人组

    4. 新建联系人组对话框设置组名,并将上面创建的联系人添加至联系人组,然后单击确认

    5. 钉钉/飞书/企微页签,单击的钉钉

    6. 创建钉钉机器人面板设置钉钉机器人参数,然后单击确定

  5. 告警规则创建完成后,单击保存

  6. 重复以上步骤创建user-service应用提供请求成功率下降的告警规则。

    错误率告警规则2

    创建完成后,在控制台的应用监控 > 应用监控告警规则页面可以查看创建的两条告警规则。两条告警规则

查看告警通知

当满足告警条件时,收到的告警通知如下所示:

  • 短信:短信告警

  • 邮件:邮件告警通知

  • 钉钉群:钉群告警通知

    在钉钉群中收到告警通知后,您可以直接在钉钉群中处理告警。具体操作,请参见在告警通知群中处理告警

管理告警

收到通知后,您可以在ARMS告警管理中查看告警的发送历史和详细告警时间信息。

  1. 登录ARMS控制台
  2. 在左侧导航栏,选择告警管理 > 告警发送历史

    告警页面可以查看告警发送历史详细告警时间信息。更多信息,请参见查看告警发送历史告警发送历史