文档

管理PostgreSQL的报警规则

更新时间:

您可以打开一键告警或设置自定义告警规则,系统在监控项数据满足条件时,会通知报警联系组中的所有联系人。

背景信息

监控报警是通过阿里云监控产品实现的。通过阿里云监控产品,您可以设置监控项,并在触发监控项的报警规则时,通过邮件和短信通知报警联系组中的所有联系人。您可以维护报警监控项对应的报警联系组,以便发生报警时,能及时通知到相关联系人。

开启一键告警

RDS PostgreSQL实例开启一键告警按钮,能够快速建立RDS的报警体系,让您可以及时知晓关键监控项的异常。

  1. 访问RDS实例列表,在上方选择地域,然后单击目标实例ID。
  2. 在左侧导航栏单击监控与报警

  3. 单击报警页签。

  4. 在页面右侧打开一键告警的开关。

    打开一键告警后,系统将自动监控如下监控项:

    规则名

    监控项

    统计周期

    报警规则

    SystemDefault_acs_rds_dashboard_PG_RO_ReadLag

    只读同步延迟

    60秒

    当只读同步延迟出现5次平均值大于等于7200秒时,通知云账号报警联系人。

    SystemDefault_acs_rds_dashboard_conn_usage

    连接数使用率

    60秒

    当连接数使用率出现5次平均值大于等于90%时,通知云账号报警联系人。

    SystemDefault_acs_rds_dashboard_local_fs_size_usage

    磁盘空间使用率

    60秒

    当磁盘空间使用率出现5次平均值大于等于90%时,通知云账号报警联系人。

    SystemDefault_acs_rds_dashboard_cpu_usage

    CPU使用率

    60秒

    当CPU使用率出现5次平均值大于等于90%时,通知云账号报警联系人。

    SystemDefault_acs_rds_dashboard_iops_usage

    IOPS使用率

    60秒

    当IOPS使用率出现5次平均值大于等于80%时,通知云账号报警联系人。

    SystemDefault_acs_rds_dashboard_PG_MaxSlotWalDelay

    最大复制槽延迟

    60秒

    当最大复制槽延迟出现5次平均值大于等于1024M时,通知云账号报警联系人。

    SystemDefault_acs_rds_dashboard_PG_SwellTime

    最长事务执行耗时

    60秒

    当最长事务执行耗时出现5次平均值大于等于36000秒时,通知云账号报警联系人。

  5. (可选)打开一键告警后,如果不指定报警联系人,则报警信息接收人默认为阿里云主账号拥有者,您可以修改报警联系人。

    1. 登录云监控控制台

    2. 在左侧导航栏,单击报警服务 > 报警联系人

    3. 报警联系人页签创建联系人。创建方法,请参见创建报警联系人

    4. 报警联系组页签的搜索框中搜索云账号报警联系人,单击编辑图标图标。

    5. 修改联系人组页面,修改联系人。

添加自定义告警规则

RDS PostgreSQL除一键告警外,还支持您根据实际需要自定义告警规则,支持的报警项如下:

数据库年龄

非活跃复制槽数量

最慢SQL执行耗时

最大复制槽延迟

只读同步延迟

只读流复制状态

最慢Standby回放延迟

最长事务执行耗时

每CPU平均活跃链接数

连接数使用率

CPU使用率

IOPS使用率

INODE使用率

磁盘空间使用率

内存使用率

  1. 访问RDS实例列表,在上方选择地域,然后单击目标实例ID。
  2. 在左侧导航栏单击监控与报警

  3. 单击报警页签。

  4. 在右侧单击报警规则设置,进入云监控控制台。

  5. 创建报警联系组,详情请参见创建报警联系人或报警联系人组

  6. 创建报警规则,详情请参见创建阈值报警规则

    说明
    • 创建报警规则时,产品选择云数据库RDS版-PostgreSQL

    • 您也可以通过标签自动监控资源。详情请参见通过标签自动监控资源