数据库自治服务DAS(Database Autonomy Service)支持监控大盘功能,您可以自主选择需要监控的数据库实例和指标,对不同数据库实例的指标进行监控对比,并且可以进行多指标联动,帮助您监控数据库实例的运行情况。
前提条件
目标数据库实例为:
RDS MySQL、自建MySQL、PolarDB MySQL版
云数据库 Tair(兼容 Redis)、自建Redis
云数据库MongoDB版、自建MongoDB
RDS PostgreSQL
RDS SQL Server
在DAS中接入对应的数据库实例,并且接入状态显示为连接正常。接入数据库实例的操作详情可参见:
新增监控大盘
查看监控大盘中目标实例的指标趋势
登录DAS控制台。
在左侧导航栏,单击监控大盘。
在自定义大盘页,选择对应的数据库引擎。
在目标数据库引擎页签,选择需要查看的监控大盘,并设置查询时间,即可查看该时间段内监控指标的趋势图。
选择时间范围时,查询结束时间需晚于查询开始时间,且查询开始时间和查询结束时间的间隔不能超过7天。
说明对于Redis数据库实例,查询开始时间和查询结束时间的间隔不能超过3小时。
通过实例筛选,您可以选择多个实例,对比查看其监控指标。
打开自动刷新,系统将以5秒为周期,刷新监控指标趋势图。
打开联动图表,开启多指标联动,查看同一时间点中不同监控指标的值。
通过图表布局,您可以设置每行显示监控指标趋势图的数量。
单击添加实例和监控指标,修改大盘中的实例或监控指标。
单击某个监控指标趋势图中的详情,放大该监控指标的趋势图,并且可以修改时间查看该监控指标不同时间的变化趋势。
单击某个监控指标趋势图中的删除,在监控大盘中删除该监控指标。
监控指标
表 1. RDS MySQL和自建MySQL监控指标
参数类型 | 参数 | 说明 |
MySQL Server | tps | TPS。 |
qps | QPS。 | |
active_session | 当前活跃会话。 | |
total_session | 当前全部会话。 | |
delete_ps | 平均每秒Delete语句执行次数。 | |
insert_ps | 平均每秒Insert语句执行次数。 | |
replace_ps | 平均每秒Replace语句执行次数。 | |
update_ps | 平均每秒Update语句执行次数。 | |
select_ps | 平均每秒Select语句执行次数。 | |
bytes_received | 平均每秒从所有客户端接收到的字节数。 | |
bytes_sent | 平均每秒发送给所有客户端的字节数。 | |
iops_usage | IOPS利用率。 | |
InnoDB存储引擎 | innodb_bp_hit | InnoDB Buffer Pool读缓存命中率。 |
innodb_bp_dirty_pct | InnoDB Buffer Pool脏页比率。 | |
innodb_bp_usage_pct | InnoDB Buffer Pool使用率。 | |
innodb_data_written | InnoDB平均每秒写字节数。 | |
innodb_data_read | InnoDB平均每秒读字节数。 | |
innodb_rows_deleted | InnoDB平均每秒删除的行数。 | |
innodb_rows_read | InnoDB平均每秒读取的行数。 | |
innodb_rows_inserted | InnoDB平均每秒插入的行数。 | |
innodb_rows_updated | InnoDB平均每秒更新的行数。 | |
MySQL服务进程 | cpu_usage | MySQL服务进程CPU使用率(阿里云数据库最高100%)。 |
mem_usage | MySQL实例内存使用率(占操作系统总数)。 | |
iops | MySQL读写次数。 | |
disk_usage | 磁盘使用率。 |
表 2. 云数据库 Tair(兼容 Redis)版和自建Redis监控指标
参数类型 | 参数 | 说明 |
数据库基本指标 | instantaneous_ops_per_sec | 每秒处理的命令数。 |
get_qps | 每秒读命令请求数。 | |
put_qps | 每秒写命令请求数。 | |
connection_usage | 连接利用率。 | |
inflow | 网络每秒的读取速率。 | |
outflow | 网络每秒的写入速率。 | |
used_memory | Redis使用其分配器分配的总字节数。 | |
mem_usage | 内存利用率。 | |
Redis 基本指标 | avg_rt | Redis平均响应时间。 |
max_rt | Redis最大响应时间。 | |
proxy.avg_rt | Redis代理节点平均响应时间。 | |
proxy.max_rt | Redis代理节点最大响应时间。 | |
proxy.connection_usage | Redis代理连接使用率。 | |
cpu_usage | Redis进程CPU使用率。 | |
Keys指标 | evicted_keys | 由于最大内存限制而逐出的Key数。 |
total_keys | 数据库中的Key总数之和。 | |
expired_keys | Key过期事件总数。 | |
Redis Keys | hit | 命中Keys。 |
miss | 未命中Keys。 |
表 3. 云数据库MongoDB版和自建MongoDB监控指标
参数类型 | 参数 | 说明 |
MongoDB基本指标 | opcounters.insert | MongoDB每秒Insert。 |
opcounters.query | MongoDB每秒Query。 | |
opcounters.update | MongoDB每秒Update。 | |
opcounters.delete | MongoDB每秒Delete。 | |
opcounters.command | MongoDB每秒Command。 | |
opcounters.getmore | MongoDB每秒Getmore。 | |
connections.current | MongoDB当前会话。 | |
metrics.cursor.open.total | MongoDB当前打开光标计数。 | |
metrics.cursor.timedOut | MongoDB超时游标计数。 | |
network.bytesIn | MongoDB每秒网络输入字节数。 | |
network.bytesOut | MongoDB每秒网络输出字节数。 | |
network.numRequests | MongoDB每秒网络请求。 | |
MongoDB服务进程 | cpu_usage | MongoDB CPU使用率。 |
mem_usage | MongoDB内存使用率。 | |
disk_usage | MongoDB磁盘使用率。 |
表 4. RDS PostgreSQL监控指标
参数类型 | 参数 | 说明 |
主机指标 | cpu_sys_ratio | PostgreSQL进程的内核态CPU占用率。 |
cpu_user_ratio | PostgreSQL进程的用户态CPU占用率。 | |
cpu_usage | PostgreSQL进程的CPU占用率。 | |
mem_usage | PostgreSQL进程的内存使用率。 | |
data.r_s | data目录所在磁盘读IOPS。 | |
data.iops | data目录所在磁盘IOPS。 | |
data.w_s | data目录所在磁盘写IOPS。 | |
local_fs_size_total | 磁盘总空间。 | |
data.fs.used | data目录所在磁盘总体使用量。 | |
data.fs.usage | data目录所在磁盘总体使用率。 | |
network_out_io | PostgreSQL进程的网络流出流量。 | |
network_io | PostgreSQL进程的网络流量。 | |
network_in_io | PostgreSQL进程的网络流入流量。 | |
PostgreSQL基础监控 | waiting_connection | 当前处于等待状态的连接数。 |
idle_in_transaction | 当前处于空闲状态的会话数。 | |
active_session | 当前活跃连接数。 | |
total_session | 当前连接总数。 | |
tup_inserted | 每秒插入记录数。 | |
tup_deleted | 每秒删除记录数。 | |
tup_updated | 每秒更新记录数。 | |
tup_returned | 每秒全表扫描记录数。 | |
tup_fetched | 每秒索引扫描回表记录数。 | |
tps | PostgreSQL TPS。 | |
xact_rollback | 每秒事务回滚数。 | |
xact_commit | 每秒事务提交数。 | |
deadlocks | 每秒死锁数。 | |
oldest_snapshot | 膨胀点,多久以前的垃圾可以被回收。 | |
max_sent_delay | PostgreSQL备库发送延迟。 | |
max_replay_delay | 备库APPLY延迟。 | |
long_query_5s | 当前系统中执行时间大于等于5秒的SQL的数量。 | |
long_query_1s | 当前系统中执行时间大于等于1秒的SQL的数量。 | |
long_query_3s | 当前系统中执行时间大于等于3秒的SQL的数量。 | |
long_idle_in_transaction_3s | 当前系统中,长期(大于等于3秒)处于空闲的事务数量。 | |
long_idle_in_transaction_5s | 当前系统中,长期(大于等于5秒)处于空闲的事务数量。 | |
long_idle_in_transaction_1s | 当前系统中,长期(大于等于1秒)处于空闲的事务数量。 | |
long_2pc_1s | 当前系统中,大于等于1秒未结束的2PC的事务数量。 | |
long_2pc_5s | 当前系统中,大于等于5秒未结束的2PC的事务数量。 | |
long_2pc_3s | 当前系统中,大于等于3秒未结束的2PC的事务数量。 |
表 5. RDS SQL Server监控指标
参数类型 | 参数 | 说明 |
SQL Server服务进程 | cpu_usage | 实例CPU使用率(占操作系统总数)。 |
db_io | 每秒IO请求次数。 | |
db_io_read | 每秒读IO请求次数。 | |
db_io_write | 每秒写IO请求次数。 | |
other_size | 系统空间使用量。 | |
log_size | 日志空间使用量。 | |
tmp_size | 临时空间使用量。 | |
ins_size | 实例总空间使用量。 | |
data_size | 数据空间使用量。 | |
数据库指标 | qps | 平均每秒SQL语句执行次数。 |
connection_reset | 每秒从连接池启动的登录总次数。 | |
active_temp_tables | 当前活跃临时表数。 | |
active_session | 当前活跃线程数。 | |
active_cursors | 当前活跃游标数。 | |
sessions | 当前总连接数。 | |
active_transactions | 当前活跃事务数。 | |
transactions | 平均每秒事务数。 | |
write_transactions | 平均每秒写事务数。 | |
read_kb | 实例平均每秒钟的输出流量。 | |
write_kb | 实例平均每秒钟的输入流量。 | |
基础监控 | cache_hit_ratio | 高速缓存命中率。 |
bufferpool | 在缓冲区高速缓存中找到而不需要从磁盘中读取的页的百分比。 | |
fullscans | 平均每秒全表扫描次数。 | |
autoparam_attempts_per_sec | 每秒的自动参数化尝试次数。 | |
forced_parameterizations_per_sec | 每秒成功执行的强制参数化次数。 | |
sql_compilations | 每秒的SQL编译次数。 | |
unsafe_autoparams_per_sec | 每秒不安全的自动参数化尝试次数。 | |
failed_autoparams_per_sec | 每秒自动参数化尝试失败次数。 | |
safe_autoparams_per_sec | 每秒安全自动参数化尝试次数。 | |
resqlcompilations | 每秒语句重新编译的次数。 | |
lazy_writes | 每秒写入磁盘的次数。 | |
checkpoint | 每秒检查点写入Page数。 | |
logout | 每秒登出次数。 | |
logins | 每秒登录次数。 | |
locktimeout | 每秒超时的锁请求数,包括对NOWAIT锁的请求。 | |
deadlock | 每秒死锁发生的次数。 | |
lock_requests_per_sec | 每秒请求的新锁和锁转换次数。 | |
lockwaits | 每秒调用者等待的锁请求数。 | |
lock_waits | 等待锁的进程的统计信息。 | |
latchwaits | 每秒未能立即授予闩锁请求次数。 | |
lock_wait_time_ms | 平均锁等待时间。 | |
average_latch_wait_time | 请求闩锁资源的平均等待时间。 | |
table_lock_escalations_per_sec | 表上的锁升级到TABLE或HoBT粒度的次数。 | |
average_lock_wait_time | 请求锁资源的平均等待时间。 | |
total_latch_wait_time | 锁在最后一秒内的总等待时间。 |
表 6. PolarDB MySQL版监控指标
参数类型 | 参数 | 说明 |
数据库指标 | com_delete | 平均每秒Delete语句执行次数。 |
com_insert | 平均每秒Insert语句执行次数。 | |
com_replace | 平均每秒Replace语句执行次数。 | |
com_select | 平均每秒Select语句执行次数。 | |
com_update | 平均每秒Update语句执行次数。 | |
qps | QPS。 | |
tps | TPS。 | |
PolarDB服务进程 | cpu_usage | 服务进程CPU使用率(200%代表使用2个CPU Core)。 |
mem_usage | 实例内存使用率(占操作系统总数)。 | |
PolarDB Server | active_session | 当前活跃会话。 |
total_session | 当前全部会话。 | |
output_traffic | 平均每秒发送给所有客户端的字节数。 | |
input_traffic | 平均每秒从所有客户端接收到的字节数。 | |
InnoDB存储引擎 | innodb_data_read | InnoDB平均每秒读字节数。 |
innodb_data_written | InnoDB平均每秒写字节数。 | |
innodb_buffer_dirty_ratio | InnoDB Buffer Pool脏页比率。 | |
innodb_buffer_read_hit | InnoDB Buffer Pool读缓存命中率。 | |
innodb_buffer_use_ratio | InnoDB Buffer Pool使用率。 | |
innodb_rows_deleted | InnoDB平均每秒删除的行数。 | |
innodb_rows_inserted | InnoDB平均每秒插入的行数。 | |
innodb_rows_read | InnoDB平均每秒读取的行数。 | |
innodb_rows_updated | InnoDB平均每秒更新的行数。 |
监控指标含义也可以在控制台的监控大盘中单击每个指标后的查看。