自定义指标监控

当您需要自定义数据库监控或者比较不同实例的运行情况时,通过监控大盘,您可以自由选择监控的实例和指标,实现自定义指标监控、不同实例间的性能对比,以及进行多指标联动分析,从而全面把握数据库的健康状况。

前提条件

RDS PostgreSQL数据库实例为高可用系列。

说明

数据库自治服务DAS从2022年5月20日开始逐步为RDS PostgreSQL提供监控大盘功能。

新增监控大盘

  1. 登录RDS管理控制台

  2. 在左侧导航栏中单击运维与监控 > 性能监测

  3. 性能监测页,单击监控大盘页签。

  4. 在目标数据库引擎页签,单击新增监控大盘

  5. 输入新增监控大盘的名称,单击确定

  6. 单击选择实例和指标,分别选中目标实例和需要监控的指标,并单击‪选择

    说明
    • 选择目标实例时,最多可同时选择32个实例进行监控。

    • 监控指标的含义请参见监控指标

    选择实例和指标

  7. 单击确认选择即可。

    说明

    如果需要修改大盘中的实例或指标,可以单击添加实例和监控指标进行修改。

查看监控大盘中目标实例的指标趋势

  1. 登录RDS管理控制台

  2. 在左侧导航栏中单击运维与监控 > 性能监测

  3. 性能监测页,单击监控大盘页签。

  4. 在目标数据库引擎页签,选择需要查看的监控大盘,并设置查询时间,即可查看该时间段内监控指标的趋势图。

    说明

    选择时间范围时,查询结束时间需晚于查询开始时间,且查询开始时间和查询结束时间的间隔不能超过七天。

    • 通过实例筛选,您可以选择多个实例,对比查看其监控指标。

    • 打开自动刷新,系统将以5秒为周期,刷新监控指标趋势图。

    • 打开联动图表,开启多指标联动,查看同一时间点中不同监控指标的值。

    • 通过图表布局,您可以设置每行显示监控指标趋势图的数量。

    • 单击添加实例和监控指标,修改大盘中的实例或监控指标。

    • 单击某个监控指标趋势图中的详情,放大该监控指标的趋势图,并且可以修改时间查看该监控指标不同时间的变化趋势。

    • 单击某个监控指标趋势图中的删除,在监控大盘中删除该监控指标。

监控指标

参数类型

参数

说明

主机指标

cpu_sys_ratio

PostgreSQL进程的内核态CPU占用率。

cpu_user_ratio

PostgreSQL进程的用户态CPU占用率。

cpu_usage

PostgreSQL进程的CPU占用率。

mem_usage

PostgreSQL进程的内存使用率。

data.r_s

data目录所在磁盘读IOPS。

data.iops

data目录所在磁盘IOPS。

data.w_s

data目录所在磁盘写IOPS。

local_fs_size_total

磁盘总空间。

data.fs.used

data目录所在磁盘总体使用量。

data.fs.usage

data目录所在磁盘总体使用率。

network_out_io

PostgreSQL进程的网络流出流量。

network_io

PostgreSQL进程的网络流量。

network_in_io

PostgreSQL进程的网络流入流量。

PostgreSQL基础监控

waiting_connection

当前处于等待状态的连接数。

idle_in_transaction

当前处于空闲状态的会话数。

active_session

当前活跃连接数。

total_session

当前连接总数。

tup_inserted

每秒插入记录数。

tup_deleted

每秒删除记录数。

tup_updated

每秒更新记录数。

tup_returned

每秒全表扫描记录数。

tup_fetched

每秒索引扫描回表记录数。

tps

PostgreSQL TPS。

xact_rollback

每秒事务回滚数。

xact_commit

每秒事务提交数。

deadlocks

每秒死锁数。

oldest_snapshot

膨胀点,多久以前的垃圾可以被回收。

max_sent_delay

PostgreSQL备库发送延迟。

max_replay_delay

备库APPLY延迟。

long_query_5s

当前系统中执行时间大于等于5秒的SQL的数量。

long_query_1s

当前系统中执行时间大于等于1秒的SQL的数量。

long_query_3s

当前系统中执行时间大于等于3秒的SQL的数量。

long_idle_in_transaction_3s

当前系统中,长期(大于等于3秒)处于空闲的事务数量。

long_idle_in_transaction_5s

当前系统中,长期(大于等于5秒)处于空闲的事务数量。

long_idle_in_transaction_1s

当前系统中,长期(大于等于1秒)处于空闲的事务数量。

long_2pc_1s

当前系统中,大于等于1秒未结束的2PC的事务数量。

long_2pc_5s

当前系统中,大于等于5秒未结束的2PC的事务数量。

long_2pc_3s

当前系统中,大于等于3秒未结束的2PC的事务数量。

说明

监控指标含义也可以在控制台的监控大盘中单击每个指标后的问号查看。