当您需要自定义数据库监控或者比较不同实例的运行情况时,通过监控大盘,您可以自由选择监控的实例和指标,实现自定义指标监控、不同实例间的性能对比,以及进行多指标联动分析,从而全面把握数据库的健康状况。
前提条件
RDS PostgreSQL数据库实例为高可用系列。
数据库自治服务DAS从2022年5月20日开始逐步为RDS PostgreSQL提供监控大盘功能。
新增监控大盘
查看监控大盘中目标实例的指标趋势
登录RDS管理控制台。
在左侧导航栏中单击运维与监控 > 性能监测。
在性能监测页,选择监控大盘页签。
在目标数据库引擎页签,选择需要查看的监控大盘,并设置查询时间,即可查看该时间段内监控指标的趋势图。
说明选择时间范围时,结束时间需晚于开始时间,且间隔不超过七天。
通过实例筛选,选择多个实例对比查看监控指标。
打开自动刷新,系统每5秒刷新一次。
打开联动图表,开启多指标联动,查看同一时间点中不同监控指标的值。
通过图表布局,您可以设置每行显示监控指标趋势图的数量。
单击添加实例和监控指标,修改大盘中的实例或监控指标。
单击某个监控指标趋势图中的详情,放大该监控指标的趋势图,并且可以修改时间查看该监控指标不同时间的变化趋势。
单击某个监控指标趋势图中的删除,在监控大盘中删除该监控指标。
监控指标
|
参数类型 |
参数 |
说明 |
|
主机指标 |
cpu_sys_ratio |
PostgreSQL进程的内核态CPU占用率。 |
|
cpu_user_ratio |
PostgreSQL进程的用户态CPU占用率。 |
|
|
cpu_usage |
PostgreSQL进程的CPU占用率。 |
|
|
mem_usage |
PostgreSQL进程的内存使用率。 |
|
|
data.r_s |
data目录所在磁盘读IOPS。 |
|
|
data.iops |
data目录所在磁盘IOPS。 |
|
|
data.w_s |
data目录所在磁盘写IOPS。 |
|
|
local_fs_size_total |
磁盘总空间。 |
|
|
data.fs.used |
data目录所在磁盘总体使用量。 |
|
|
data.fs.usage |
data目录所在磁盘总体使用率。 |
|
|
network_out_io |
PostgreSQL进程的网络流出流量。 |
|
|
network_io |
PostgreSQL进程的网络流量。 |
|
|
network_in_io |
PostgreSQL进程的网络流入流量。 |
|
|
PostgreSQL基础监控 |
waiting_connection |
当前处于等待状态的连接数。 |
|
idle_in_transaction |
当前处于空闲状态的会话数。 |
|
|
active_session |
当前活跃连接数。 |
|
|
total_session |
当前连接总数。 |
|
|
tup_inserted |
每秒插入记录数。 |
|
|
tup_deleted |
每秒删除记录数。 |
|
|
tup_updated |
每秒更新记录数。 |
|
|
tup_returned |
每秒全表扫描记录数。 |
|
|
tup_fetched |
每秒索引扫描回表记录数。 |
|
|
tps |
PostgreSQL TPS。 |
|
|
xact_rollback |
每秒事务回滚数。 |
|
|
xact_commit |
每秒事务提交数。 |
|
|
deadlocks |
每秒死锁数。 |
|
|
oldest_snapshot |
膨胀点,多久以前的垃圾可以被回收。 |
|
|
max_sent_delay |
PostgreSQL备库发送延迟。 |
|
|
max_replay_delay |
备库APPLY延迟。 |
|
|
long_query_5s |
当前系统中执行时间大于等于5秒的SQL的数量。 |
|
|
long_query_1s |
当前系统中执行时间大于等于1秒的SQL的数量。 |
|
|
long_query_3s |
当前系统中执行时间大于等于3秒的SQL的数量。 |
|
|
long_idle_in_transaction_3s |
当前系统中,长期(大于等于3秒)处于空闲的事务数量。 |
|
|
long_idle_in_transaction_5s |
当前系统中,长期(大于等于5秒)处于空闲的事务数量。 |
|
|
long_idle_in_transaction_1s |
当前系统中,长期(大于等于1秒)处于空闲的事务数量。 |
|
|
long_2pc_1s |
当前系统中,大于等于1秒未结束的2PC的事务数量。 |
|
|
long_2pc_5s |
当前系统中,大于等于5秒未结束的2PC的事务数量。 |
|
|
long_2pc_3s |
当前系统中,大于等于3秒未结束的2PC的事务数量。 |
监控指标含义也可以在控制台的监控大盘中单击每个指标后的
查看。
。