告警管理

RDS洞察提供告警模块,您可以自定义告警通知规则与查看告警历史。

前提条件

已接入应用数据库可观测

告警规则

  1. 登录云监控2.0控制台,选择目标工作空间,在左侧导航栏选择应用中心 > 数据库洞察

  2. 数据库洞察导航页面,选择告警管理 > 告警规则

  3. 告警规则页面,单击创建告警规则

  4. 创建告警规则面板中,设置参数。

    1. 规则名称:自定义报警规则名称。

    2. 监控类型:默认RDS 洞察监控类型。

    3. 请参考如下设置。

      参数

      描述

      数据源类型

      所属目标监控类型的数据源。

      地域

      数据源的地域。

      Prometheus实例

      根据选择目标实例设置报警规则。

      检测条件定义方式

      自定义PromQL:根据您的需求可以自定义 PromQL查询语法。请参见PromQL函数使用示例

      基于预定义指标配置

      • 指标分组:选择指标分组。

      • 指标:选择指标。

      • 检测条件:通过设置比较符和个数,设置检测条件。

      • PromQL 预览:预览预定义的指标PromQL语句。

      严重等级

      设置告警规则严重等级。

      • P1: 紧急

      • P2: 错误

      • P3: 警告

      • P4: 普通

      持续时间

      设置告警的持续时间。

      告警检测周期

      设置告警检测周期的时间。

      数据完成后再检测

      选择检测方式。

      内容

      自定义警报信息内容。

    4. 标签注解:设置报警规则的标签和注解。包括标签名称和标签值。

    5. 设置告警通知

      1. 通知对象:根据您的需求,可以选择一个或者多个通知对象方式,如:联系人/联系组/钉钉/企业微信/飞书/Slack/自定义Webhook,触发告警后接收告警信息。

      2. 集成到 ARMS 告警管理:根据需求选择是或者否。

        说明

        告警事件默认会发送到 ARMS 告警运维中心,如需设置告警通知,请前往 ARMS 告警运维中心进行配置。

      3. 行动集成:选择特定的云产品或者第三方服务,处理告警后续的事务,如:日志服务、轻量消息队列、函数计算和第三方服务pagerDuty、Webhook。

      4. 通道沉默周期:报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:1、5、10、15、30、50分钟,1、3、6、12、24小时。

        说明

        例如:当通道沉默周期选择12小时时,如果报警未恢复正常,则间隔12小时后,云监控会再次发送报警通知。

      5. 生效时间:报警规则的生效时间。报警规则仅在生效期内才会发送报警通知。

        说明
        • 当报警规则不在生效期时,不会发送报警通知,但是报警历史记录仍然会显示在报警历史列表中。

        • 通知时间支持24小时内,可跨天,例如23:00 至 第二天01:00

  5. 完成设置,单击确定

告警历史

请参考告警中心文档告警历史