本文通过示例说明如何创建应用监控告警并处理告警通知。
前提条件
已接入应用监控,具体操作,请参见应用监控接入概述。
背景信息
EDAS应用监控告警支持对采集到的各种应用指标配置告警规则。您可以根据需求和业务场景配置合理的告警规则,即可在应用不符合预期时收到通知,以便及时做出响应。本文以下述场景为例说明如何使用EDAS应用监控告警规则。
示例场景:核心业务请求延时过高或成功率下降。
示例应用名称:user-service。user-service应用是部署在阿里云容器服务Kubernetes版集群上面的一个Java应用,且已经成功接入了EDAS应用监控。
user-service应用是公司的核心服务,如果其接口可用性下降将导致严重的后果,因此,当此应用提供的接口调用延时增加或者成功率下降时,运维人员需及时收到通知并且迅速响应。
在此背景下,运维人员需要关注的指标有:
应用提供服务的平均响应时间
应用提供服务的请求成功率
步骤一:验证应用是否成功接入应用监控
执行以下步骤验证user-service应用是否成功接入应用监控。
登录EDAS控制台。
在左侧导航栏选择应用管理>应用列表,在展开的列表中查找并单击user-service应用名称。
在左侧导航栏单击应用总览。
进入应用总览页面,查看应用总览页面是否有数据。
如果页面有数据,说明应用已经成功接入应用监控;如果页面没有任何数据,说明应用没有成功接入,请将应用重新接入应用监控。
说明示例应用是容器服务Kubernetes版集群的Java应用,如果您的应用是其它类型,接入应用监控成功之后的页面显示可能与上图不同,但是只要页面有指标数据就说明已经接入成功。
步骤二:进入创建应用监控告警规则页面
登录EDAS控制台。
在左侧导航栏,单击 ,在顶部菜单栏选择地域并在页面上方选择所属微服务空间,在集群类型下拉列表,选择K8s集群,然后在页面单击具体的应用名称。
在左侧导航栏中选择 。
在告警规则页面右上角,单击创建应用监控告警规则。
在创建应用监控告警规则页面,设置告警应用为user-service、指标类型为应用调用类型统计。
步骤三:创建告警规则
本示例中需要创建以下两条告警规则,并在告警触发时通过短信,邮件和钉钉群通知联系人:
user-service应用提供请求延时过高的告警规则:
最近3分钟应用提供服务调用响应时间大于等于500 ms。
user-service应用提供请求成功率下降的告警规则:
最近3分钟应用提供服务调用错误率小于等于90%。
一般认为接口在短时间内有所波动为正常现象,持续性的异常才需要关注并且响应。所以在添加告警规则时,可以设置当最近3分钟的平均延时都比较高或者请求失败率低于90%的时候才需要告警。您在创建应用监控告警规则时,可以根据需要指定不同的时间和指标计算方法。
在创建应用监控告警规则页面输入告警名称,添加告警条件。
此处先创建user-service应用提供请求延时过高的告警条件。
设置通知策略。
如果您已经创建过通知策略,则在通知策略区域选择已有的通知策略。
如果您之前没有创建过通知策略,则执行步骤3新建通知策略。新建完通知策略后,在创建应用监控告警规则页面刷新并选择通知策略。
可选:单击通知策略右侧的新建通知策略。
在右侧弹出的新建通知策略面板中,选择通知人,并设置其他参数,然后单击确定。
如果您已经创建过联系人,则在通知人区域选择已有的联系人。
如果您之前没有创建过联系人,则执行步骤4新建联系人。新建完联系人后,在新建通知策略面板刷新并选择通知人。
可选:单击通知人右侧的新建联系人。
在联系人页面创建联系人、联系人组和钉群。
在联系人页签,单击右上角的新建联系人。
在新建联系人对话框中输入联系人参数,然后单击确认。
在联系人组页签,单击右上角的新建联系组。
在新建联系组对话框设置组名,并将上面创建的联系人添加至联系人组,然后单击确认。
创建完成后,在联系人组页签中可以查看已创建的联系人组。
在钉群页签,单击右上角的新建钉群。
在新建钉群对话框设置钉群参数,然后单击确认。
创建完成后,在钉群页签中可以查看已创建的钉群。
告警规则创建完成后,单击保存。
重复以上步骤创建user-service应用提供请求成功率下降的告警规则。
创建完成后,在控制台的
页面可以查看创建的两条告警规则。
查看告警通知
当满足告警条件时,收到的告警通知如下所示:
短信:
邮件:
钉钉群:
在钉钉群中收到告警通知后,您可以直接在钉钉群中处理告警。具体操作,请参见在钉钉群中处理告警。
处理告警
收到通知后,您可以在告警管理中查看告警的发送历史和详细告警时间信息。