除标准监控外,RDS PostgreSQL还提供了丰富的增强性能监控项,您可以通过RDS管理控制台查看这些监控数据。

操作步骤

  1. 访问RDS实例列表,在上方选择地域,然后单击目标实例ID。
  2. 在左侧导航栏单击监控与报警
  3. 选择增强监控页签,单击指标管理,分别在操作系统指标页签和数据库指标页签中选择需要显示的指标项,各指标项详情,请参见参考信息
    显示指标项
    说明
    • 增强监控页面中最多能显示30个指标。
    • 您可以将已选择显示的指标项方案应用到当前地域的所有RDS PostgreSQL实例:
      • 如果当前为云盘版实例,将会应用到已存在以及以后创建的RDS PostgreSQL云盘实例。
      • 如果当前为本地盘实例,将会应用到已存在以及以后创建的RDS PostgreSQL本地盘实例。
  4. 单击更新指标后,在增强监控页即可看到对应的指标项监控数据。
  5. 增强监控页面还提供了多种查询设置,使您更方便地查看相应的监控数据。更多功能
    序号 功能 说明
    查询时间范围 支持按照预设的时间范围和自定义时间范围查询。
    • 预设时间范围支持:30分钟、1小时、2小时、6小时、1天、7天和30天。
    • 自定义时间范围:开始时间(YYYY-MM-DD hh:mm:ss) - 结束时间(YYYY-MM-DD hh:mm:ss)
    聚合方式 支持按照如下聚合方式显示指标结果。
    • 求平均
    • 求最大
    • 求最小
    布局 支持按如下分布调整显示结果的布局。
    • 一列
    • 二列
    • 三列
    • 四列
    时间粒度 表示显示图表中横坐标的时间粒度。
    时间粒度与查询时间相关联,对应关系如下:
    • 查询时间范围小于等于1小时,时间粒度为5秒
    • 查询时间范围大于1小时且小于等于2小时,时间粒度为10秒
    • 查询时间范围大于2小时且小于等于6小时,时间粒度为30秒
    • 查询时间范围大于6小时且小于等于12小时,时间粒度为1分钟
    • 查询时间范围大于12小时且小于等于1天, 时间粒度为2分钟
    • 查询时间范围大于1天且小于等于5天, 时间粒度为10分钟
    • 查询时间范围大于5天且小于等于15天,时间粒度为30分钟
    • 查询时间范围大于15天且小于等于30天,时间粒度为1小时
    光标联动 支持打开光标联动开关,当光标悬浮在图表的某一时间点时,其它图表联动显示对应时间点的指标数据。
    刷新 支持通过手动刷新来更新图表数据。

参考信息

操作系统指标和数据库指标的详细信息如下。

操作系统指标
指标分类 指标名称 指标含义 指标单位 RDS PostgreSQL 9.4 、10本地盘实例 RDS PostgreSQL 10、11、12、13云盘版实例
CPU使用率 os.cpu_usage.sys sys cpu使用率,sys cpu使用量 / cpu总量 % ✔️ ✔️
os.cpu_usage.user user cpu使用率,user cpu使用量 / cpu总量 % ✔️ ✔️
os.cpu_usage.total cpu使用率,(sys + user) cpu使用量 / cpu总量 % ✔️ ✔️
CPU按照进程堆叠 os.cpu_process.backend backend cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
os.cpu_process.bgwriter bgwriter cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
os.cpu_process.checkpoint checkpoint cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
os.cpu_process.logger logger cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
os.cpu_process.pgstat pgstat cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
os.cpu_process.walwriter walwriter cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
os.cpu_process.autovacuum autovacuum cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
os.cpu_process.walsender walsender cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
os.cpu_process.postmaster postmaster cpu使用量(1cpu=100%,2cpu=200%,以次类推) % ✔️ ✔️
IOPS os.iops.total 磁盘读写IOPS Counts/s ✔️
os.iops.read 磁盘读IOPS Counts/s ✔️
os.iops.write 磁盘写IOPS Counts/s ✔️
os.iops.data 本地数据盘IOPS Counts/s ✔️
os.iops.wal 本地日志盘IOPS Counts/s ✔️
IO吞吐 os.iothroughput.total 磁盘读写吞吐量 MB/s ✔️
os.iothroughput.read 磁盘读吞吐量 MB/s ✔️
os.iothroughput.write 磁盘写吞吐量 MB/s ✔️
os.iothroughput.data 本地数据盘吞吐 MB/s ✔️
os.iothroughput.wal 本地日志盘吞吐 MB/s ✔️
磁盘使用率 os.fs_usage.total 磁盘使用率 % ✔️
磁盘空间 os.fs_size.used 磁盘已用空间 MB ✔️
os.fs_size.total 磁盘总空间 MB ✔️
os.fs_size.log_dir 日志文件大小(包含审计日志、错误日志、慢SQL日志) MB ✔️ ✔️
os.fs_size.wal_dir wal文件大小 MB ✔️ ✔️
os.fs_size.base_dir 数据文件大小(不包含日志和wal) MB ✔️ ✔️
网络流量 os.network.rx 网络输入流量 MB/s ✔️
os.network.tx 网络输出流量 MB/s ✔️
数据库指标
说明 下表中监控指标的更多解释,请参见PostgreSQL官方文档
指标分类 指标名称 指标含义 指标单位 RDS PostgreSQL 9.4 、10本地盘实例 RDS PostgreSQL 10、11、12、13云盘版实例
SharedBuffers命中率 db.buffers.hit_ratio shared_buffers命中率 % ✔️ ✔️
SharedBuffers命中次数 db.buffers.blks_hit shared_buffers每秒命中数 Blocks/s ✔️ ✔️
IO db.io.blks_read backend进程每秒磁盘read次数(OS buffered read) Counts/s ✔️ ✔️
db.io.buffers_backend backend进程每秒磁盘write次数(OS buffered write) Counts/s ✔️ ✔️
db.io.buffers_checkpoint checkpoint进程每秒磁盘write次数(OS buffered write) Counts/s ✔️ ✔️
db.io.buffers_clean bgwriter进程每秒磁盘write次数(OS buffered write) Counts/s ✔️ ✔️
db.io.buffers_backend_fsync backend进程每秒执行磁盘fsync的次数 Counts/s ✔️ ✔️
Checkpoint写时间 db.checkpoint.checkpoints_sync_time checkpoint进程平均每秒磁盘fsync时间 ms/s ✔️ ✔️
db.checkpoint.checkpoints_write_time checkpoint进程平均每秒磁盘write时间(OS buffered write) ms/s ✔️ ✔️
Checkpoint次数 db.checkpoint.checkpoints_timed 每秒内核调度的checkpoints数量 Counts/s ✔️ ✔️
db.checkpoint.checkpoints_req 每秒外部请求的checkpoints数量 Counts/s ✔️ ✔️
连接 db.connections.active 活跃连接数 Counts ✔️ ✔️
db.connections.waiting 等待连接数 Counts ✔️ ✔️
db.connections.idle 空闲连接数 Counts ✔️ ✔️
db.connections.total 连接数 Counts ✔️ ✔️
db.connections.spec 规格连接数 Counts ✔️ ✔️
事务TPS db.transactions.xact_commit 每秒写事务提交数 Counts/s ✔️ ✔️
db.transactions.xact_rollback 每秒写事务回滚数 Counts/s ✔️ ✔️
事务状态 db.transactions.active 活跃状态事务数 Counts ✔️ ✔️
db.transactions.waiting 等待状态事务数 Counts ✔️ ✔️
db.transactions.idle idle-in-transaction状态事务数(注意:不合理状态,需要尽快处理) Counts ✔️ ✔️
SQL db.sql.tup_returned 每秒返回行数 Tuples/s ✔️ ✔️
db.sql.tup_fetched 每秒读取行数 Tuples/s ✔️ ✔️
db.sql.tup_inserted 每秒插入行数 Tuples/s ✔️ ✔️
db.sql.tup_deleted 每秒删除行数 Tuples/s ✔️ ✔️
db.sql.tup_updated 每秒更新行数 Tuples/s ✔️ ✔️
慢SQL db.slow_sql.one_second 已执行1s的SQL数 Counts ✔️ ✔️
db.slow_sql.three_seconds 已执行3s的SQL数 Counts ✔️ ✔️
db.slow_sql.five_seconds 已执行5s的SQL数 Counts ✔️ ✔️
长事务 db.long_transactions.active_one_second 已执行1s的事务数 Counts ✔️ ✔️
db.long_transactions.active_three_seconds 已执行3s的事务数 Counts ✔️ ✔️
db.long_transactions.idle_one_second 已空闲1s的事务数 Counts ✔️ ✔️
db.long_transactions.idle_three_seconds 已空闲3s的事务数 Counts ✔️ ✔️
db.long_transactions.idle_five_seconds 已空闲5s的事务数 Counts ✔️ ✔️
db.long_transactions.two_pc_one_second 已执行1s的两阶段事务 Counts ✔️ ✔️
db.long_transactions.two_pc_three_seconds 已执行3s的两阶段事务 Counts ✔️ ✔️
db.long_transactions.two_pc_five_seconds 已执行5s的两阶段事务 Counts ✔️ ✔️
临时文件数 db.temp.temp_files 每秒临时文件生成个数 Counts/s ✔️ ✔️
临时文件大小 db.temp.temp_bytes 每秒临时文件数据生成大小 Bytes/s ✔️ ✔️
膨胀点 db.swell.swell_time 膨胀点,最长事务已执行时间 s ✔️ ✔️
数据库最大年龄 db.age.max_age 数据库最大年龄 xids ✔️ ✔️
只读同步延迟 db.ro_replica.replay_lag 只读实例replay延迟时间 s ✔️
db.ro_replica.write_lag 只读实例write延迟时间 s ✔️
db.ro_replica.flush_lag 只读实例flush延迟时间 s ✔️
逻辑复制 db.slots.max_slot_wal_delay 最大ReplicationSlot wal复制延迟(注意:复制位点之后的wal需要被保留,该值较大时会导致wal堆积,需要尽快处理) MB ✔️ ✔️

相关API

API 描述
查询性能数据 查询性能数据