RDS洞察提供告警模块,您可以自定义告警通知规则与查看告警历史。
前提条件
已接入应用数据库可观测。
告警规则
登录云监控2.0控制台,选择目标工作空间,在左侧导航栏选择 。
在数据库洞察导航页面,选择
。在告警规则页面,单击创建告警规则。
在创建告警规则面板中,设置参数。
规则名称:自定义报警规则名称。
监控类型:默认RDS 洞察监控类型。
请参考如下设置。
参数
描述
数据源类型
所属目标监控类型的数据源。
地域
数据源的地域。
Prometheus实例
根据选择目标实例设置报警规则。
检测条件定义方式
自定义PromQL:根据您的需求可以自定义 PromQL查询语法。请参见PromQL函数使用示例。
基于预定义指标配置:
指标分组:选择指标分组。
指标:选择指标。
检测条件:通过设置比较符和个数,设置检测条件。
PromQL 预览:预览预定义的指标PromQL语句。
严重等级
设置告警规则严重等级。
P1: 紧急
P2: 错误
P3: 警告
P4: 普通
持续时间
设置告警的持续时间。
告警检测周期
设置告警检测周期的时间。
数据完成后再检测
选择检测方式。
内容
自定义警报信息内容。
标签和注解:设置报警规则的标签和注解。包括标签名称和标签值。
设置告警通知。
通知对象:根据您的需求,可以选择一个或者多个通知对象方式,如:联系人/联系组/钉钉/企业微信/飞书/Slack/自定义Webhook,触发告警后接收告警信息。
集成到 ARMS 告警管理:根据需求选择是或者否。
说明告警事件默认会发送到 ARMS 告警运维中心,如需设置告警通知,请前往 ARMS 告警运维中心进行配置。
行动集成:选择特定的云产品或者第三方服务,处理告警后续的事务,如:日志服务、轻量消息队列、函数计算和第三方服务pagerDuty、Webhook。
通道沉默周期:报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:1、5、10、15、30、50分钟,1、3、6、12、24小时。
说明例如:当通道沉默周期选择12小时时,如果报警未恢复正常,则间隔12小时后,云监控会再次发送报警通知。
生效时间:报警规则的生效时间。报警规则仅在生效期内才会发送报警通知。
说明当报警规则不在生效期时,不会发送报警通知,但是报警历史记录仍然会显示在报警历史列表中。
通知时间支持24小时内,可跨天,例如23:00 至 第二天01:00
完成设置,单击确定。
告警历史
请参考告警中心文档告警历史。