本文通过示例说明如何创建应用监控告警并处理告警通知。
前提条件
背景信息
EDAS应用监控告警支持对采集到的各种应用指标配置告警规则。您可以根据需求和业务场景配置合理的告警规则,即可在应用不符合预期时收到通知,以便及时做出响应。本文以下述场景为例说明如何使用EDAS应用监控告警规则。
示例场景:核心业务请求延时过高或成功率下降。
示例应用名称:user-service。user-service应用是部署在阿里云容器服务Kubernetes版集群上面的一个Java应用,且已经成功接入了EDAS应用监控。
user-service应用是公司的核心服务,如果其接口可用性下降将导致严重的后果,因此,当此应用提供的接口调用延时增加或者成功率下降时,运维人员需及时收到通知并且迅速响应。
- 应用提供服务的平均响应时间
- 应用提供服务的请求成功率
步骤一:验证应用是否成功接入应用监控
执行以下步骤验证user-service应用是否成功接入应用监控。
步骤二:进入创建应用监控告警规则页面
- 登录EDAS控制台。
- 在顶部菜单栏,选择地域。
- 在应用列表页面集群类型的下拉列表中,选择EDAS自带K8s集群或容器服务/Serverless K8s集群,然后在应用列表页面单击目标应用的应用名称。
- 在左侧导航栏中选择 。
- 在告警规则页面右上角,单击创建应用监控告警规则。
- 在创建应用监控告警规则页面,设置告警应用为user-service、指标类型为应用调用类型统计。
步骤三:创建告警规则
本示例中需要创建以下两条告警规则,并在告警触发时通过短信,邮件和钉钉群通知联系人:
- user-service应用提供请求延时过高的告警规则:
最近3分钟应用提供服务调用响应时间大于等于500 ms。
- user-service应用提供请求成功率下降的告警规则:
最近3分钟应用提供服务调用错误率小于等于90%。
查看告警通知
当满足告警条件时,收到的告警通知如下所示:
- 短信:
- 邮件:
- 钉钉群:
在钉钉群中收到告警通知后,您可以直接在钉钉群中处理告警。具体操作,请参见在钉钉群中处理告警。
处理告警
收到通知后,您可以在告警管理中查看告警的发送历史和详细告警时间信息。