数据库自治服务DAS(Database Autonomy Service)为RDS PostgreSQL提供监控大盘功能,您可以自主选择需要监控的数据库实例和指标,对不同数据库实例的指标进行监控对比,并且可以进行多指标联动,帮助您监控数据库实例的运行情况。

前提条件

RDS PostgreSQL数据库实例为高可用版。

说明 数据库自治服务DAS从2022年5月20日开始逐步为RDS PostgreSQL提供监控大盘功能。

新增监控大盘

  1. 登录RDS管理控制台
  2. 在左侧导航栏中单击性能中心,进入性能中心页。
  3. 性能中心页,单击监控大盘页签。
  4. 在目标数据库引擎页签,单击新增监控大盘
  5. 输入新增监控大盘的名称,单击确定
  6. 单击选择实例和指标,分别选中目标实例和需要监控的指标,并单击‪选择
    说明
    • 选择目标实例时,最多可同时选择32个实例进行监控。
    • 监控指标的含义请参见监控指标
    选择实例和指标
  7. 单击确认选择即可。
    说明 如果需要修改大盘中的实例或指标,可以单击添加实例和监控指标进行修改。

查看监控大盘中目标实例的指标趋势

  1. 登录RDS管理控制台
  2. 在左侧导航栏中单击性能中心,进入性能中心页。
  3. 性能中心页,单击监控大盘页签。
  4. 在目标数据库引擎页签,选择需要查看的监控大盘,并设置查询时间,即可查看该时间段内监控指标的趋势图。
    说明 选择时间范围时,查询结束时间需晚于查询开始时间,且查询开始时间和查询结束时间的间隔不能超过七天。
    • 通过实例筛选,您可以选择多个实例,对比查看其监控指标。
    • 打开自动刷新,系统将以5秒为周期,刷新监控指标趋势图。
    • 打开联动图表,开启多指标联动,查看同一时间点中不同监控指标的值。
    • 通过图表布局,您可以设置每行显示监控指标趋势图的数量。
    • 单击添加实例和监控指标,修改大盘中的实例或监控指标。
    • 单击某个监控指标趋势图中的详情,放大该监控指标的趋势图,并且可以修改时间查看该监控指标不同时间的变化趋势。
    • 单击某个监控指标趋势图中的删除,在监控大盘中删除该监控指标。

监控指标

参数类型参数说明
主机指标cpu_sys_ratioPostgreSQL进程的内核态CPU占用率。
cpu_user_ratioPostgreSQL进程的用户态CPU占用率。
cpu_usagePostgreSQL进程的CPU占用率。
mem_usagePostgreSQL进程的内存使用率。
data.r_sdata目录所在磁盘读IOPS。
data.iopsdata目录所在磁盘IOPS。
data.w_sdata目录所在磁盘写IOPS。
local_fs_size_total磁盘总空间。
data.fs.useddata目录所在磁盘总体使用量。
data.fs.usagedata目录所在磁盘总体使用率。
network_out_ioPostgreSQL进程的网络流出流量。
network_ioPostgreSQL进程的网络流量。
network_in_ioPostgreSQL进程的网络流入流量。
PostgreSQL基础监控waiting_connection当前处于等待状态的连接数。
idle_in_transaction当前处于空闲状态的会话数。
active_session当前活跃连接数。
total_session当前连接总数。
tup_inserted每秒插入记录数。
tup_deleted每秒删除记录数。
tup_updated每秒更新记录数。
tup_returned每秒全表扫描记录数。
tup_fetched每秒索引扫描回表记录数。
tpsPostgreSQL TPS。
xact_rollback每秒事务回滚数。
xact_commit每秒事务提交数。
deadlocks每秒死锁数。
oldest_snapshot膨胀点,多久以前的垃圾可以被回收。
max_sent_delayPostgreSQL备库发送延迟。
max_replay_delay备库APPLY延迟。
long_query_5s当前系统中执行时间大于等于5秒的SQL的数量。
long_query_1s当前系统中执行时间大于等于1秒的SQL的数量。
long_query_3s当前系统中执行时间大于等于3秒的SQL的数量。
long_idle_in_transaction_3s当前系统中,长期(大于等于3秒)处于空闲的事务数量。
long_idle_in_transaction_5s当前系统中,长期(大于等于5秒)处于空闲的事务数量。
long_idle_in_transaction_1s当前系统中,长期(大于等于1秒)处于空闲的事务数量。
long_2pc_1s当前系统中,大于等于1秒未结束的2PC的事务数量。
long_2pc_5s当前系统中,大于等于5秒未结束的2PC的事务数量。
long_2pc_3s当前系统中,大于等于3秒未结束的2PC的事务数量。
说明 监控指标含义也可以在控制台的监控大盘中单击每个指标后的问号查看。