日志服务已内置CloudLens for CLB告警监控规则,您只需添加对应的告警规则即可实时监控CLB实例,并可通过钉钉等渠道接收到告警通知。本文介绍设置告警的相关操作。
背景信息
CloudLens for CLB预设了基线告警、同环比告警、智能告警等告警监控规则,包含QPS、延迟、错误率、流量等,并支持短信、钉钉、邮件、语音、自定义Webhook等通知方式,您可以根据实际应用场景选择开启不同的告警。每种类型的告警特点如下:
基线告警:超过或低于某个基准线即触发告警,例如错误率高于1%触发告警。
同环比告警:当前的值相比历史某一时间点的变化率,例如流量相比昨天降低10%触发告警。
智能告警:CloudLens for CLB预设了AIOps巡检策略,在发现QPS、延迟等异常的时候会自动记录异常事件,您可以直接设置发现某个异常时触发告警。
操作步骤
- 登录日志服务控制台。
在日志应用区域的云产品Lens页签中,单击CloudLens for CLB。
在左侧导航栏中,单击异常检测。
在告警规则页签中,单击新建告警右侧的。
单击从模板新建。
在告警监控规则面板中,配置如下参数,单击确定。
参数
说明
规则名称
告警监控规则的名称。
检查频率
日志服务根据您配置的频率对查询和分析结果进行检查。
每小时:每小时检查一次查询和分析结果。
每天:在每天的某个固定时间点检查一次查询和分析结果。
每周:在周几的某个固定时间点检查一次查询和分析结果。
固定间隔:按照固定间隔检查查询和分析结果。
Cron:通过Cron表达式指定时间间隔,按照指定的时间间隔检查查询和分析结果。
说明Cron表达式在日志服务的告警规则里最小精度为分钟,格式为24小时制。例如:
0/5 * * * *
从0分钟开始,每隔5分钟检查一次0 0/1 * * *
从0点0分开始,每隔1小时检查一次0 18 * * *
每天18点0分检查一次0 0 1 * *
每月1日0点0分检查一次
Cron表达式语法,可参见Cron定时任务。
查询统计
单击输入框,在查询统计对话框中,设置查询和分析语句。
关联报表页签:选择监控仪表盘。
高级配置页签:
配置多个查询统计时,您可以指定集合操作关联多个查询结果。更多信息,请参见设置查询统计语句。
分组评估
日志服务支持对查询和分析结果进行分组。更多信息,请参见设置分组评估。
标签自定义:日志服务根据您配置的字段对查询和分析结果进行分组。分组后,每个组单独评估触发条件。在每个检查周期内,查询和分析结果满足触发条件时,各个分组各自产生一条告警。
支持设置多个字段。
不分组:在每个检查周期内,满足触发条件时,只产生一条告警。
标签自动:当您在查询统计中选择指标库(即监控时序数据的查询和分析结果)时 ,日志服务支持标签自动分组。
分组后,每个组单独评估触发条件。在每个检查周期内,查询和分析结果满足触发条件时,各个分组各自产生一条告警。
触发条件
配置触发条件及严重度。
触发条件
有数据:当查询和分析结果中存在数据时,触发告警。
有特定条数据:当查询和分析结果中存在N条数据时,触发告警。
有数据匹配:当查询和分析结果中存在数据满足告警表达式时,触发告警。
有特定条数据匹配:当查询和分析结果中存在N条数据满足告警表达式时,触发告警。
严重度
主要用于告警降噪控制和告警通知控制,即您在创建告警策略或行动策略时,可添加关于告警严重度的判断条件。更多信息,请参见设置告警严重度。
简单配置:直接选择告警严重度,则表示通过该规则产生的告警都为同一严重度。
分条件配置:单击添加,分条件设置告警严重度。
告警条件表达式的相关语法,请参见告警条件表达式语法。
添加标签
日志服务允许您给产生的告警添加标识性属性,键值对格式。主要用于告警降噪控制和告警通知控制,即您在创建告警策略或行动策略时,可添加关于标签的判断条件。更多信息,请参见添加标签和标注。
添加标注
日志服务允许您给产生的告警添加非标识性属性,键值对格式。主要用于告警降噪控制和告警通知控制,即您在创建告警策略或行动策略时,可添加关于标注的判断条件。更多信息,请参见添加标签和标注。
您还可以打开自动添加标注开关,系统自动在告警中添加__count__等信息。更多信息,请参见自动标注。
恢复通知
打开恢复通知开关后,告警恢复时触发一条恢复告警。例如您创建了一个告警监控规则,用于监控各个主机的CPU指标,当CPU使用率超过95%时触发告警,主机CPU使用率下降为正常值(低于等于95%)后发送一条恢复通知。更多信息,请参见设置恢复通知。
高级配置>连续触发阈值
连续多少次执行检查评估都满足触发条件时,才会触发一次告警。不满足触发条件时不计入统计。
高级配置>无数据告警
打开无数据告警开关后,如果查询和分析的结果(有多个时,进行集合操作后的结果)为无数据的次数超过连续触发阈值,则产生一条告警。更多信息,请参见无数据告警。
输出目标
输出目标用于配置告警事件的输出位置,可以配置一个或多个输出目标。
事件库:将告警事件写入到EventStore。
云监控事件中心:将告警事件写入到云监控系统事件中心,通过云监控对告警进行管理和通知。
SLS通知:将告警事件输出到SLS的通知服务,通过告警策略、行动策略等对告警进行管理和通知。
输出目标-事件库
输出目标-云监控事件中心
开启:打开云监控事件中心开启开关后,告警将发送到云监控事件中心。更多信息,请参见查看系统事件。
输出目标-SLS通知
开启:打开SLS通知开关后,告警将发送到SLS通知服务进行后续的管理和通知。
告警策略
极简模式
普通模式
日志服务默认使用SLS内置动态告警策略(sls.builtin.dynamic)进行告警管理。
选择内置的或自定义的行动策略进行告警通知。如何创建行动策略,请参见创建行动策略。
重复等待:在重复等待时间内,重复的告警只触发一次行动策略,即只发送一次告警通知。
高级模式
相关文档
管理告警规则请参见管理告警监控规则。