当您需要自定义数据库监控或者比较不同实例的运行情况时,通过监控大盘,您可以自由选择监控的实例和指标,实现自定义指标监控、不同实例间的性能对比,以及进行多指标联动分析,从而全面把握数据库的健康状况。
背景信息
数据库自治服务DAS从2022年5月20日开始逐步为RDS SQL Server提供监控大盘功能。
新增监控大盘
查看监控大盘中目标实例的指标趋势
登录RDS管理控制台。
在左侧导航栏中单击运维与监控 > 性能监测。
在性能监测页,单击监控大盘页签。
在目标数据库引擎页签,选择需要查看的监控大盘,并设置查询时间,即可查看该时间段内监控指标的趋势图。
说明选择时间范围时,查询结束时间需晚于查询开始时间,且查询开始时间和查询结束时间的间隔不能超过七天。
通过实例筛选,您可以选择多个实例,对比查看其监控指标。
打开自动刷新,系统将以5秒为周期,刷新监控指标趋势图。
打开联动图表,开启多指标联动,查看同一时间点中不同监控指标的值。
通过图表布局,您可以设置每行显示监控指标趋势图的数量。
单击添加实例和监控指标,修改大盘中的实例或监控指标。
单击某个监控指标趋势图中的详情,放大该监控指标的趋势图,并且可以修改时间查看该监控指标不同时间的变化趋势。
单击某个监控指标趋势图中的删除,在监控大盘中删除该监控指标。
监控指标
参数类型 | 参数 | 说明 |
SQL Server服务进程 | cpu_usage | 实例CPU使用率(占操作系统总数)。 |
db_io | 每秒IO请求次数。 | |
db_io_read | 每秒读IO请求次数。 | |
db_io_write | 每秒写IO请求次数。 | |
other_size | 系统空间使用量。 | |
log_size | 日志空间使用量。 | |
tmp_size | 临时空间使用量。 | |
ins_size | 实例总空间使用量。 | |
data_size | 数据空间使用量。 | |
数据库指标 | qps | 平均每秒SQL语句执行次数。 |
connection_reset | 每秒从连接池启动的登录总次数。 | |
active_temp_tables | 当前活跃临时表数。 | |
active_session | 当前活跃线程数。 | |
active_cursors | 当前活跃游标数。 | |
sessions | 当前总连接数。 | |
active_transactions | 当前活跃事务数。 | |
transactions | 平均每秒事务数。 | |
write_transactions | 平均每秒写事务数。 | |
read_kb | 实例平均每秒钟的输出流量。 | |
write_kb | 实例平均每秒钟的输入流量。 | |
基础监控 | cache_hit_ratio | 高速缓存命中率。 |
bufferpool | 在缓冲区高速缓存中找到而不需要从磁盘中读取的页的百分比。 | |
fullscans | 平均每秒全表扫描次数。 | |
autoparam_attempts_per_sec | 每秒的自动参数化尝试次数。 | |
forced_parameterizations_per_sec | 每秒成功执行的强制参数化次数。 | |
sql_compilations | 每秒的SQL编译次数。 | |
unsafe_autoparams_per_sec | 每秒不安全的自动参数化尝试次数。 | |
failed_autoparams_per_sec | 每秒自动参数化尝试失败次数。 | |
safe_autoparams_per_sec | 每秒安全自动参数化尝试次数。 | |
resqlcompilations | 每秒语句重新编译的次数。 | |
lazy_writes | 每秒写入磁盘的次数。 | |
checkpoint | 每秒检查点写入Page数。 | |
logout | 每秒登出次数。 | |
logins | 每秒登录次数。 | |
locktimeout | 每秒超时的锁请求数,包括对NOWAIT锁的请求。 | |
deadlock | 每秒死锁发生的次数。 | |
lock_requests_per_sec | 每秒请求的新锁和锁转换次数。 | |
lockwaits | 每秒调用者等待的锁请求数。 | |
lock_waits | 等待锁的进程的统计信息。 | |
latchwaits | 每秒未能立即授予闩锁请求次数。 | |
lock_wait_time_ms | 平均锁等待时间。 | |
average_latch_wait_time | 请求闩锁资源的平均等待时间。 | |
table_lock_escalations_per_sec | 表上的锁升级到TABLE或HoBT粒度的次数。 | |
average_lock_wait_time | 请求锁资源的平均等待时间。 | |
total_latch_wait_time | 锁在最后一秒内的总等待时间。 |
监控指标含义也可以在控制台的监控大盘中单击每个指标后的查看。