除标准监控外,RDS PostgreSQL还提供了丰富的增强性能监控项,您可以通过RDS管理控制台查看这些监控数据。

操作步骤

  1. 访问RDS实例列表,在上方选择地域,然后单击目标实例ID。
  2. 在左侧导航栏单击监控与报警
  3. 选择增强监控页签,单击指标管理,分别在操作系统指标页签和数据库指标页签中选择需要显示的指标项,各指标项详情,请参见参考信息
    显示指标项
    说明
    • 增强监控页面中最多能显示30个指标。
    • 您可以将已选择显示的指标项方案应用到当前地域的所有RDS PostgreSQL实例:
      • 如果当前为云盘版实例,将会应用到已存在以及以后创建的RDS PostgreSQL云盘实例。
      • 如果当前为本地盘实例,将会应用到已存在以及以后创建的RDS PostgreSQL本地盘实例。
  4. 单击更新指标后,在增强监控页即可看到对应的指标项监控数据。
  5. 增强监控页面还提供了多种查询设置,使您更方便地查看相应的监控数据。更多功能
    序号 功能 说明
    查询时间范围 支持按照预设的时间范围和自定义时间范围查询。
    • 预设时间范围支持:30分钟、1小时、2小时、6小时、1天、7天和30天。
    • 自定义时间范围:开始时间(YYYY-MM-DD hh:mm:ss) - 结束时间(YYYY-MM-DD hh:mm:ss)
    聚合方式 支持按照如下聚合方式显示指标结果。
    • 求平均
    • 求最大
    • 求最小
    布局 支持按如下分布调整显示结果的布局。
    • 一列
    • 二列
    • 三列
    • 四列
    时间粒度 表示显示图表中横坐标的时间粒度。
    时间粒度与查询时间相关联,对应关系如下:
    • 查询时间范围小于等于1小时,时间粒度为5秒
    • 查询时间范围大于1小时且小于等于2小时,时间粒度为10秒
    • 查询时间范围大于2小时且小于等于6小时,时间粒度为30秒
    • 查询时间范围大于6小时且小于等于12小时,时间粒度为1分钟
    • 查询时间范围大于12小时且小于等于1天, 时间粒度为2分钟
    • 查询时间范围大于1天且小于等于5天, 时间粒度为10分钟
    • 查询时间范围大于5天且小于等于15天,时间粒度为30分钟
    • 查询时间范围大于15天且小于等于30天,时间粒度为1小时
    光标联动 支持打开光标联动开关,当光标悬浮在图表的某一时间点时,其它图表联动显示对应时间点的指标数据。
    刷新 支持通过手动刷新来更新图表数据。

参考信息

操作系统指标和数据库指标的详细信息如下。

操作系统指标
指标分类 指标名称 指标含义 指标单位 RDS PostgreSQL 9.4 、10本地盘实例 RDS PostgreSQL 10、11、12、13云盘版实例
CPU使用率
  • 平均值:os.cpu_usage.sys.avg
  • 最大值:os.cpu_usage.sys.max
  • 最小值:os.cpu_usage.sys.min
sys cpu使用率,sys cpu使用量 / cpu总量 % ✔️ ✔️
  • 平均值:os.cpu_usage.user.avg
  • 最大值:os.cpu_usage.user.max
  • 最小值:os.cpu_usage.user.min
user cpu使用率,user cpu使用量 / cpu总量 % ✔️ ✔️
  • 平均值:os.cpu_usage.total.avg
  • 最大值:os.cpu_usage.total.max
  • 最小值:os.cpu_usage.total.min
cpu使用率,(sys + user) cpu使用量 / cpu总量 % ✔️ ✔️
CPU按照进程堆叠
  • 平均值:os.cpu_process.backend.avg
  • 最大值:os.cpu_process.backend.max
  • 最小值:os.cpu_process.backend.min
backend cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
  • 平均值:os.cpu_process.bgwriter.avg
  • 最大值:os.cpu_process.bgwriter.max
  • 最小值:os.cpu_process.bgwriter.min
bgwriter cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
  • 平均值:os.cpu_process.checkpoint.avg
  • 最大值:os.cpu_process.checkpoint.max
  • 最小值:os.cpu_process.checkpoint.min
checkpoint cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
  • 平均值:os.cpu_process.logger.avg
  • 最大值:os.cpu_process.logger.max
  • 最小值:os.cpu_process.logger.min
logger cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
  • 平均值:os.cpu_process.pgstat.avg
  • 最大值:os.cpu_process.pgstat.max
  • 最小值:os.cpu_process.pgstat.min
pgstat cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
  • 平均值:os.cpu_process.walwriter.avg
  • 最大值:os.cpu_process.walwriter.max
  • 最小值:os.cpu_process.walwriter.min
walwriter cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
  • 平均值:os.cpu_process.autovacuum.avg
  • 最大值:os.cpu_process.autovacuum.max
  • 最小值:os.cpu_process.autovacuum.min
autovacuum cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
  • 平均值:os.cpu_process.walsender.avg
  • 最大值:os.cpu_process.walsender.max
  • 最小值:os.cpu_process.walsender.min
walsender cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
  • 平均值:os.cpu_process.postmaster.avg
  • 最大值:os.cpu_process.postmaster.max
  • 最小值:os.cpu_process.postmaster.min
postmaster cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
IOPS
  • 平均值:os.iops.total.avg
  • 最大值:os.iops.total.max
  • 最小值:os.iops.total.min
磁盘读写IOPS Counts/s ✔️
  • 平均值:os.iops.read.avg
  • 最大值:os.iops.read.max
  • 最小值:os.iops.read.min
磁盘读IOPS Counts/s ✔️
  • 平均值:os.iops.write.avg
  • 最大值:os.iops.write.max
  • 最小值:os.iops.write.min
磁盘写IOPS Counts/s ✔️
  • 平均值:os.iops.data.avg
  • 最大值:os.iops.data.max
  • 最小值:os.iops.data.min
本地数据盘IOPS Counts/s ✔️
  • 平均值:os.iops.wal.avg
  • 最大值:os.iops.wal.max
  • 最小值:os.iops.wal.min
本地日志盘IOPS Counts/s ✔️
IO吞吐
  • 平均值:os.iothroughput.total.avg
  • 最大值:os.iothroughput.total.max
  • 最小值:os.iothroughput.total.min
磁盘读写吞吐量 MB/s ✔️
  • 平均值:os.iothroughput.read.avg
  • 最大值:os.iothroughput.read.max
  • 最小值:os.iothroughput.read.min
磁盘读吞吐量 MB/s ✔️
  • 平均值:os.iothroughput.write.avg
  • 最大值:os.iothroughput.write.max
  • 最小值:os.iothroughput.write.min
磁盘写吞吐量 MB/s ✔️
  • 平均值:os.iothroughput.data.avg
  • 最大值:os.iothroughput.data.max
  • 最小值:os.iothroughput.data.min
本地数据盘吞吐 MB/s ✔️
  • 平均值:os.iothroughput.wal.avg
  • 最大值:os.iothroughput.wal.max
  • 最小值:os.iothroughput.wal.min
本地日志盘吞吐 MB/s ✔️
磁盘使用率
  • 平均值:os.fs_usage.total.avg
  • 最大值:os.fs_usage.total.max
  • 最小值:os.fs_usage.total.min
磁盘使用率 % ✔️
磁盘空间
  • 平均值:os.fs_size.used.avg
  • 最大值:os.fs_size.used.max
  • 最小值:os.fs_size.used.min
磁盘已用空间 MB ✔️
  • 平均值:os.fs_size.total.avg
  • 最大值:os.fs_size.total.max
  • 最小值:os.fs_size.total.min
磁盘总空间 MB ✔️
  • 平均值:os.fs_size.log_dir.avg
  • 最大值:os.fs_size.log_dir.max
  • 最小值:os.fs_size.log_dir.min
日志文件大小(包含审计日志、错误日志、慢SQL日志) MB ✔️ ✔️
  • 平均值:os.fs_size.wal_dir.avg
  • 最大值:os.fs_size.wal_dir.max
  • 最小值:os.fs_size.wal_dir.min
wal文件大小 MB ✔️ ✔️
  • 平均值:os.fs_size.base_dir.avg
  • 最大值:os.fs_size.base_dir.max
  • 最小值:os.fs_size.base_dir.min
数据文件大小(不包含日志和wal) MB ✔️ ✔️
网络流量
  • 平均值:os.network.rx.avg
  • 最大值:os.network.rx.max
  • 最小值:os.network.rx.min
网络输入流量 MB/s ✔️
  • 平均值:os.network.tx.avg
  • 最大值:os.network.tx.max
  • 最小值:os.network.tx.min
网络输出流量 MB/s ✔️
数据库指标
说明 下表中监控指标的更多解释,请参见PostgreSQL官方文档
指标分类 指标名称 指标含义 指标单位 RDS PostgreSQL 9.4 、10本地盘实例 RDS PostgreSQL 10、11、12、13云盘版实例
SharedBuffers命中率
  • 平均值:db.buffers.hit_ratio.avg
  • 最大值:db.buffers.hit_ratio.max
  • 最小值:db.buffers.hit_ratio.min
shared_buffers命中率 % ✔️ ✔️
SharedBuffers命中次数
  • 平均值:db.buffers.blks_hit.avg
  • 最大值:db.buffers.blks_hit.max
  • 最小值:db.buffers.blks_hit.min
shared_buffers每秒命中数 Blocks/s ✔️ ✔️
IO
  • 平均值:db.io.blks_read.avg
  • 最大值:db.io.blks_read.max
  • 最小值:db.io.blks_read.min
backend进程每秒磁盘read次数(OS buffered read) Counts/s ✔️ ✔️
  • 平均值:db.io.buffers_backend.avg
  • 最大值:db.io.buffers_backend.max
  • 最小值:db.io.buffers_backend.min
backend进程每秒磁盘write次数(OS buffered write) Counts/s ✔️ ✔️
  • 平均值:db.io.buffers_checkpoint.avg
  • 最大值:db.io.buffers_checkpoint.max
  • 最小值:db.io.buffers_checkpoint.min
checkpoint进程每秒磁盘write次数(OS buffered write) Counts/s ✔️ ✔️
  • 平均值:db.io.buffers_clean.avg
  • 最大值:db.io.buffers_clean.max
  • 最小值:db.io.buffers_clean.min
bgwriter进程每秒磁盘write次数(OS buffered write) Counts/s ✔️ ✔️
  • 平均值:db.io.buffers_backend_fsync.avg
  • 最大值:db.io.buffers_backend_fsync.max
  • 最小值:db.io.buffers_backend_fsync.min
backend进程每秒执行磁盘fsync的次数 Counts/s ✔️ ✔️
Checkpoint写时间
  • 平均值:db.checkpoint.checkpoints_sync_time.avg
  • 最大值:db.checkpoint.checkpoints_sync_time.max
  • 最小值:db.checkpoint.checkpoints_sync_time.min
checkpoint进程平均每秒磁盘fsync时间 ms/s ✔️ ✔️
  • 平均值:db.checkpoint.checkpoints_write_time.avg
  • 最大值:db.checkpoint.checkpoints_write_time.max
  • 最小值:db.checkpoint.checkpoints_write_time.min
checkpoint进程平均每秒磁盘write时间(OS buffered write) ms/s ✔️ ✔️
Checkpoint次数
  • 平均值:db.checkpoint.checkpoints_timed.avg
  • 最大值:db.checkpoint.checkpoints_timed.max
  • 最小值:db.checkpoint.checkpoints_timed.min
每秒内核调度的checkpoints数量 Counts/s ✔️ ✔️
  • 平均值:db.checkpoint.checkpoints_req.avg
  • 最大值:db.checkpoint.checkpoints_req.max
  • 最小值:db.checkpoint.checkpoints_req.min
每秒外部请求的checkpoints数量 Counts/s ✔️ ✔️
连接
  • 平均值:db.connections.active.avg
  • 最大值:db.connections.active.max
  • 最小值:db.connections.active.min
活跃连接数 Counts ✔️ ✔️
  • 平均值:db.connections.waiting.avg
  • 最大值:db.connections.waiting.max
  • 最小值:db.connections.waiting.min
等待连接数 Counts ✔️ ✔️
  • 平均值:db.connections.idle.avg
  • 最大值:db.connections.idle.max
  • 最小值:db.connections.idle.min
空闲连接数 Counts ✔️ ✔️
  • 平均值:db.connections.total.avg
  • 最大值:db.connections.total.max
  • 最小值:db.connections.total.min
连接数 Counts ✔️ ✔️
  • 平均值:db.connections.spec.avg
  • 最大值:db.connections.spec.max
  • 最小值:db.connections.spec.min
规格连接数 Counts ✔️ ✔️
事务TPS
  • 平均值:db.transactions.xact_commit.avg
  • 最大值:db.transactions.xact_commit.max
  • 最小值:db.transactions.xact_commit.min
每秒写事务提交数 Counts/s ✔️ ✔️
  • 平均值:db.transactions.xact_rollback.avg
  • 最大值:db.transactions.xact_rollback.max
  • 最小值:db.transactions.xact_rollback.min
每秒写事务回滚数 Counts/s ✔️ ✔️
事务状态
  • 平均值:db.transactions.active.avg
  • 最大值:db.transactions.active.max
  • 最小值:db.transactions.active.min
活跃状态事务数 Counts ✔️ ✔️
  • 平均值:db.transactions.waiting.avg
  • 最大值:db.transactions.waiting.max
  • 最小值:db.transactions.waiting.min
等待状态事务数 Counts ✔️ ✔️
  • 平均值:db.transactions.idle.avg
  • 最大值:db.transactions.idle.max
  • 最小值:db.transactions.idle.min
idle-in-transaction状态事务数(注意:不合理状态,需要尽快处理) Counts ✔️ ✔️
SQL
  • 平均值:db.sql.tup_returned.avg
  • 最大值:db.sql.tup_returned.max
  • 最小值:db.sql.tup_returned.min
每秒返回行数 Tuples/s ✔️ ✔️
  • 平均值:db.sql.tup_fetched.avg
  • 最大值:db.sql.tup_fetched.max
  • 最小值:db.sql.tup_fetched.min
每秒读取行数 Tuples/s ✔️ ✔️
  • 平均值:db.sql.tup_inserted.avg
  • 最大值:db.sql.tup_inserted.max
  • 最小值:db.sql.tup_inserted.min
每秒插入行数 Tuples/s ✔️ ✔️
  • 平均值:db.sql.tup_deleted.avg
  • 最大值:db.sql.tup_deleted.max
  • 最小值:db.sql.tup_deleted.min
每秒删除行数 Tuples/s ✔️ ✔️
  • 平均值:db.sql.tup_updated.avg
  • 最大值:db.sql.tup_updated.max
  • 最小值:db.sql.tup_updated.min
每秒更新行数 Tuples/s ✔️ ✔️
慢SQL
  • 平均值:db.slow_sql.one_second.avg
  • 最大值:db.slow_sql.one_second.max
  • 最小值:db.slow_sql.one_second.min
已执行1s的SQL数 Counts ✔️ ✔️
  • 平均值:db.slow_sql.three_seconds.avg
  • 最大值:db.slow_sql.three_seconds.max
  • 最小值:db.slow_sql.three_seconds.min
已执行3s的SQL数 Counts ✔️ ✔️
  • 平均值:db.slow_sql.five_seconds.avg
  • 最大值:db.slow_sql.five_seconds.max
  • 最小值:db.slow_sql.five_seconds.min
已执行5s的SQL数 Counts ✔️ ✔️
长事务
  • 平均值:db.long_transactions.active_one_second.avg
  • 最大值:db.long_transactions.active_one_second.max
  • 最小值:db.long_transactions.active_one_second.min
已执行1s的事务数 Counts ✔️ ✔️
  • 平均值:db.long_transactions.active_three_seconds.avg
  • 最大值:db.long_transactions.active_three_seconds.max
  • 最小值:db.long_transactions.active_three_seconds.min
已执行3s的事务数 Counts ✔️ ✔️
  • 平均值:db.long_transactions.idle_one_second.avg
  • 最大值:db.long_transactions.idle_one_second.max
  • 最小值:db.long_transactions.idle_one_second.min
已空闲1s的事务数 Counts ✔️ ✔️
  • 平均值:db.long_transactions.idle_three_seconds.avg
  • 最大值:db.long_transactions.idle_three_seconds.max
  • 最小值:db.long_transactions.idle_three_seconds.min
已空闲3s的事务数 Counts ✔️ ✔️
  • 平均值:db.long_transactions.idle_five_seconds.avg
  • 最大值:db.long_transactions.idle_five_seconds.max
  • 最小值:db.long_transactions.idle_five_seconds.min
已空闲5s的事务数 Counts ✔️ ✔️
  • 平均值:db.long_transactions.two_pc_one_second.avg
  • 最大值:db.long_transactions.two_pc_one_second.max
  • 最小值:db.long_transactions.two_pc_one_second.min
已执行1s的两阶段事务 Counts ✔️ ✔️
  • 平均值:db.long_transactions.two_pc_three_seconds.avg
  • 最大值:db.long_transactions.two_pc_three_seconds.max
  • 最小值:db.long_transactions.two_pc_three_seconds.min
已执行3s的两阶段事务 Counts ✔️ ✔️
  • 平均值:db.long_transactions.two_pc_five_seconds.avg
  • 最大值:db.long_transactions.two_pc_five_seconds.max
  • 最小值:db.long_transactions.two_pc_five_seconds.min
已执行5s的两阶段事务 Counts ✔️ ✔️
临时文件数
  • 平均值:db.temp.temp_files.avg
  • 最大值:db.temp.temp_files.max
  • 最小值:db.temp.temp_files.min
每秒临时文件生成个数 Counts/s ✔️ ✔️
临时文件大小
  • 平均值:db.temp.temp_bytes.avg
  • 最大值:db.temp.temp_bytes.max
  • 最小值:db.temp.temp_bytes.min
每秒临时文件数据生成大小 Bytes/s ✔️ ✔️
膨胀点
  • 平均值:db.swell.swell_time.avg
  • 最大值:db.swell.swell_time.max
  • 最小值:db.swell.swell_time.min
膨胀点,最长事务已执行时间 s ✔️ ✔️
数据库最大年龄
  • 平均值:db.age.max_age.avg
  • 最大值:db.age.max_age.max
  • 最小值:db.age.max_age.min
数据库最大年龄 xids ✔️ ✔️
只读同步延迟
  • 平均值:db.ro_replica.replay_lag.avg
  • 最大值:db.ro_replica.replay_lag.max
  • 最小值:db.ro_replica.replay_lag.min
只读实例replay延迟时间 s ✔️
  • 平均值:db.ro_replica.write_lag.avg
  • 最大值:db.ro_replica.write_lag.max
  • 最小值:db.ro_replica.write_lag.min
只读实例write延迟时间 s ✔️
  • 平均值:db.ro_replica.flush_lag.avg
  • 最大值:db.ro_replica.flush_lag.max
  • 最小值:db.ro_replica.flush_lag.min
只读实例flush延迟时间 s ✔️
逻辑复制
  • 平均值:db.slots.max_slot_wal_delay.avg
  • 最大值:db.slots.max_slot_wal_delay.max
  • 最小值:db.slots.max_slot_wal_delay.min
最大ReplicationSlot wal复制延迟(注意:复制位点之后的wal需要被保留,该值较大时会导致wal堆积,需要尽快处理) MB ✔️ ✔️

相关API

API 描述
DescribeDBInstancePerformance 查询性能数据
DescribeAvailableMetrics 获取增强监控指标列表
ModifyDBInstanceMetrics 变更增强监控指标项
DescribeDBInstanceMetrics 查询实例已开启的增强指标