创建应用监控告警并发送告警通知

本文通过示例说明如何创建应用监控告警并处理告警通知。

前提条件

已接入应用监控,具体操作,请参见应用监控接入概述

背景信息

EDAS应用监控告警支持对采集到的各种应用指标配置告警规则。您可以根据需求和业务场景配置合理的告警规则,即可在应用不符合预期时收到通知,以便及时做出响应。本文以下述场景为例说明如何使用EDAS应用监控告警规则。

示例场景:核心业务请求延时过高或成功率下降。

示例应用名称:user-serviceuser-service应用是部署在阿里云容器服务Kubernetes版集群上面的一个Java应用,且已经成功接入了EDAS应用监控。

user-service应用是公司的核心服务,如果其接口可用性下降将导致严重的后果,因此,当此应用提供的接口调用延时增加或者成功率下降时,运维人员需及时收到通知并且迅速响应。

在此背景下,运维人员需要关注的指标有:

  • 应用提供服务的平均响应时间

  • 应用提供服务的请求成功率

步骤一:验证应用是否成功接入应用监控

执行以下步骤验证user-service应用是否成功接入应用监控。

  1. 登录EDAS控制台

  2. 在左侧导航栏选择应用管理>应用列表,在展开的列表中查找并单击user-service应用名称。

    1. 在左侧导航栏单击应用总览

    2. 进入应用总览页面,查看应用总览页面是否有数据。

    如果页面有数据,说明应用已经成功接入应用监控;如果页面没有任何数据,说明应用没有成功接入,请将应用重新接入应用监控。

    说明

    示例应用是容器服务Kubernetes版集群的Java应用,如果您的应用是其它类型,接入应用监控成功之后的页面显示可能与上图不同,但是只要页面有指标数据就说明已经接入成功。

步骤二:进入创建应用监控告警规则页面

  1. 登录EDAS控制台

  2. 在左侧导航栏,单击应用管理 > 应用列表,在顶部菜单栏选择地域并在页面上方选择所属微服务空间,在集群类型下拉列表,选择K8s集群,然后在页面单击具体的应用名称。

  3. 在左侧导航栏中选择告警管理 > 告警规则

  4. 告警规则页面右上角,单击创建应用监控告警规则

  5. 创建应用监控告警规则页面,设置告警应用user-service指标类型应用调用类型统计

步骤三:创建告警规则

本示例中需要创建以下两条告警规则,并在告警触发时通过短信,邮件和钉钉群通知联系人:

  • user-service应用提供请求延时过高的告警规则:

    最近3分钟应用提供服务调用响应时间大于等于500 ms。
  • user-service应用提供请求成功率下降的告警规则:

    最近3分钟应用提供服务调用错误率小于等于90%。
说明

一般认为接口在短时间内有所波动为正常现象,持续性的异常才需要关注并且响应。所以在添加告警规则时,可以设置当最近3分钟的平均延时都比较高或者请求失败率低于90%的时候才需要告警。您在创建应用监控告警规则时,可以根据需要指定不同的时间和指标计算方法。

  1. 创建应用监控告警规则页面输入告警名称,添加告警条件。

    此处先创建user-service应用提供请求延时过高的告警条件。

  2. 设置通知策略。

    • 如果您已经创建过通知策略,则在通知策略区域选择已有的通知策略。

    • 如果您之前没有创建过通知策略,则执行步骤3新建通知策略。新建完通知策略后,在创建应用监控告警规则页面刷新并选择通知策略

  3. 可选:单击通知策略右侧的新建通知策略

    在右侧弹出的新建通知策略面板中,选择通知人,并设置其他参数,然后单击确定

    • 如果您已经创建过联系人,则在通知人区域选择已有的联系人。

    • 如果您之前没有创建过联系人,则执行步骤4新建联系人。新建完联系人后,在新建通知策略面板刷新并选择通知人

    新建通知策略

  4. 可选:单击通知人右侧的新建联系人

    在联系人页面创建联系人、联系人组和钉群。

    1. 联系人页签,单击右上角的新建联系人

    2. 新建联系人对话框中输入联系人参数,然后单击确认

    3. 联系人组页签,单击右上角的新建联系组

    4. 新建联系组对话框设置组名,并将上面创建的联系人添加至联系人组,然后单击确认

      创建完成后,在联系人组页签中可以查看已创建的联系人组。

    5. 钉群页签,单击右上角的新建钉群

    6. 新建钉群对话框设置钉群参数,然后单击确认

      创建完成后,在钉群页签中可以查看已创建的钉群。新建钉群

  5. 告警规则创建完成后,单击保存

  6. 重复以上步骤创建user-service应用提供请求成功率下降的告警规则。

    创建完成后,在控制台的告警管理 > 告警规则页面可以查看创建的两条告警规则。两条告警规则

查看告警通知

当满足告警条件时,收到的告警通知如下所示:

  • 短信:短信告警

  • 邮件:邮件告警通知

  • 钉钉群:钉群告警通知

    在钉钉群中收到告警通知后,您可以直接在钉钉群中处理告警。具体操作,请参见在钉钉群中处理告警

处理告警

收到通知后,您可以在告警管理中查看告警的发送历史和详细告警时间信息。

  1. 登录EDAS控制台

  2. 在左侧导航栏,单击应用管理 > 应用列表,在顶部菜单栏选择地域并在页面上方选择所属微服务空间,在集群类型下拉列表,选择K8s集群,然后在页面单击具体的应用名称。

  3. 在左侧导航栏,选择告警管理 > 告警发送历史

    告警页面可以查看告警发送历史详细告警时间信息。更多信息,请参见查看告警发送历史告警发送历史