本文介绍云数据库MongoDB基本监控、高级监控和性能趋势功能支持的监控项、监控指标及其具体含义。
为了更好地展示效果,部分控制台上的Bytes单位会自动帮您折算成MB、GB或TB单位。
基础监控
不同类型实例支持的监控项请以控制台为准。
监控项 | key | 指标名 | 指标含义 | 单位 | 支持的实例类型 |
磁盘空间使用率 | DiskUsage | disk_usage | 实例的磁盘使用率。 | % |
|
网络流量 | MongoDB_Network | bytes_in | 实例的网络进口流量。 | Bytes | |
bytes_out | 实例的网络出口流量。 | Bytes | |||
num_requests | 实例处理的请求数。 | 个 | |||
操作QPS数 | MongoDB_Opcounters | insert | 实例的插入操作QPS数。 | 个 | |
query | 实例的查询操作QPS数。 | 个 | |||
update | 实例的更新操作QPS数。 | 个 | |||
delete | 实例的删除操作QPS数。 | 个 | |||
getmore | 实例的读取操作QPS数。 | 个 | |||
command | 实例的协议命令操作QPS数。 | 个 | |||
连接数 | MongoDB_TotalConns | connections_active | 实例当前活跃连接数。 | 个 | |
current_conn | 实例当前连接数。 | 个 | |||
connections_totalCreated_ps | 实例每秒新建连接的总数。 | 个 |
| ||
connections_available | 实例当前可用的连接数。 | 个 | |||
连接数使用率 | ConnectionUsage | conn_usage | 实例的连接数使用率。 | % | |
CPU使用率 | CpuUsage | cpu_usage | 实例的CPU使用率。 | % | |
内存使用率 | MemoryUsage | mem_usage | 实例的内存使用率。 | % | |
IOPS使用量 | MongoDB_IOPS | iops | IOPS使用量。 说明
| 次/秒 | |
IOPS使用率 | IOPSUsage | iops_usage | 实例的IOPS使用率。 说明 4.2版本副本集云盘版实例以及4.2版本分片集群云盘版实例暂不支持查看IOPS使用量和IOPS使用率。 | % | |
磁盘空间使用量 | MongoDB_DetailedSpaceUsage | ins_size | 实例的磁盘使用空间。 | Bytes | |
data_size | 数据磁盘使用空间(不包括local库),主要包括collection开头的数据物理⽂件,索引开头的索引物理⽂件和部分元数据物理⽂件,例如WiredTiger.wt。 | Bytes | |||
log_size | local库的物理大小、mongodb运行日志大小和部分审计日志大小。 | Bytes | |||
操作详情 | MongoDB_OperationDetails | operation_exactIDCount_ps | 针对特定ID进行计数操作的次数。 | 个 | |
operation_scanAndOrder_ps | 未用索引的排序操作数。 | 个 | |||
operation_writeConflicts_ps | 发生写冲突的次数。 | 个 | |||
MBPS | MongoDB_Disk_Detail | read_io_bandwidth_mbps | 磁盘读取的吞吐量。 | MB/秒 | |
write_io_bandwidth_mbps | 磁盘写入的吞吐量。 | MB/秒 | |||
io_bandwidth_mbps | 磁盘总吞吐量。 | MB/秒 | |||
事务操作数 | MongoDB_Transactions | trans_totalPrepared_ps | 已准备好的事务数。 | 个 | |
trans_totalPreparedThenCommited_ps | 已准备好的事务中成功提交的事务数。 | 个 | |||
trans_totalPreparedThenAborted_ps | 已准备好的事务中成功回滚的事务数。 | 个 | |||
trans_totalStarted_ps | 已启动的事务数。 | 个 | |||
trans_totalCommited_ps | 成功提交的事务数。 | 个 | |||
trans_totalAborted_ps | 成功回滚的事务数。 | 个 | |||
Cursors | MongoDB_AllCursors | total_open | 实例当前打开的Cursor数量。 | 个 | |
timed_out | 实例因超时关闭的Cursor数量。 | 个 | |||
job_cursors_closed | 实例因关闭会话关闭的Cursor数量。 | 个 | |||
pinned_open | 实例当前打开且超时的Cursor数量。 | 个 | |||
noTimeout_open | 实例当前打开且未超时的Cursor数量。 | 个 |
| ||
WiredTiger | MongoDB_Wt_Cache | bytes_read_into_cache | 读入缓存的字节数。 | Bytes | |
bytes_written_from_cache | 从缓存写出的字节数。 | Bytes | |||
maximum_bytes_configured | 最大缓存大小。 | Bytes | |||
WT并发事务数 | MongoDB_Wt_Concurrent_Trans | write_concurrent_trans_out | 当前写并发事务数。 | 个 | |
write_concurrent_trans_available | 可用的写并发事务数。 | 个 | |||
read_concurrent_trans_out | 当前读并发事务数。 | 个 | |||
read_concurrent_trans_available | 可用的读并发事务数。 | 个 | |||
WiredTigerUsage | MongoDB_WTCacheUsage | wt_cache_dirty_usage | WiredTiger脏缓存使用率。 | % | |
wt_cache_usage | WiredTiger缓存使用率。 | % | |||
平均响应时间 | MongoDB_RT | avg_rt | 实例平均响应时间。 | 微秒 | |
reads_avg_rt | 读操作平均响应时间。 | 微秒 | |||
writes_avg_rt | 写操作平均响应时间。 | 微秒 | |||
commands_avg_rt | 命令操作平均响应时间。 | 微秒 | |||
trans_avg_rt | 事务操作平均响应时间。 | 微秒 | |||
影响文档数量 | MongoDB_Documents | document_deleted_ps | 实例删除的文档数量。 | 个 | |
document_inserted_ps | 实例插入的文档数量。 | 个 | |||
document_returned_ps | 实例返回的文档数量。 | 个 | |||
document_updated_ps | 实例更新的文档数量。 | 个 | |||
GlobalLock | MongoDB_GlobalLocks | gl_ac_readers | 执行读操作的活跃客户端连接数。 | 个 | |
gl_ac_writers | 执行写操作的活跃客户端连接数。 | 个 | |||
gl_cq_writers | 排队等待写锁的操作数。 | 个 | |||
gl_cq_readers | 排队等待读锁的操作数。 | 个 | |||
gl_cq_total | 排队等待锁定的操作总数。 | 个 | |||
查询扫描索引与文档数量 | MongoDB_QueryExecutors | queryExecutor_scannedObject_ps | 查询扫描文档的数量。 | 个 | |
queryExecutor_scanned_ps | 查询扫描索引的数量。 | 个 | |||
TTL | MongoDB_TTLs | ttl_deletedDocuments_ps | 因TTL索引而删除的文档数量。 | 个 | |
ttl_passes_ps | 后台TTL线程进行删除的次数。 | 个 | |||
Repl Opcounters | MongoDB_ReplOpcounters | repl_command | 复制集中Command命令的操作数。 | 个 | |
repl_delete | 复制集中Delete命令的操作数。 | 个 | |||
repl_getmore | 复制集中Getmore命令的操作数。 | 个 | |||
repl_insert | 复制集中Insert命令的操作数。 | 个 | |||
repl_query | 复制集中Query命令的操作数。 | 个 | |||
repl_update | 复制集中Update命令的操作数。 | 个 | |||
Eviction扫描数 | MongoDB_WtCacheHPCheckEntriesWalked | wiredTiger_cache_hazardPointerCheckEntriesWalked | Eviction时扫描hazard pointer array的内容的数量。 | 个 | |
Lock Acquisitions | MongoDB_WtLockAcquisitions | wt_checkPoint_lock | 检查点锁获取次数。 | 个 | |
wt_dhandle_read_lock | 数据句柄读锁获取次数。 | 个 | |||
wt_dhandle_write_lock | 数据句柄写锁获取次数。 | 个 | |||
wt_metadata_lock | 元数据锁获取次数。 | 个 | |||
wt_schema_lock | 模式锁获取次数。 | 个 | |||
wt_table_read_lock | 表读锁获取次数。 | 个 | |||
wt_table_write_lock | 表写锁获取次数。 | 个 | |||
wt_txn_global_read_lock | 事务全局读锁获取次数。 | 个 | |||
wt_txn_global_write_lock | 事务全局写锁获取次数。 | 个 | |||
MBPS使用率 | MongoDB_MbpsUsage | total_mbps_usage | 磁盘读写带宽使用率。 说明 仅支持云盘版实例。 | % |
|
主备延时 | MongoDB_Repl_Lag | repl_lag | 实例主备节点的数据同步延时。 说明
| 秒 |
|
Oplog保留时长 | MongoDB_OplogTimeInterval | oplog_time_interval | Oplog保留时长。 | 小时 | |
moveChunk | MongoDB_MoveChunks | moveChunk_donor_started_ps | 当前节点作为范围迁移源的次数。 | 个 |
|
moveChunk_recip_stared_ps | 当前节点作为范围迁移目标的次数。 | 个 | |||
每次访问个数 | - | sl_qps | 实例的每秒访问次数。 | 个 |
|
高级监控
仅单节点、副本集和分片集群实例支持高级监控。
不同类型实例支持的监控项请以控制台为准。
支持的实例 | 监控项 | 监控指标及说明 | 说明 | 单位 |
| CPU使用率 | cpu_usage | 实例的CPU使用率。 | % |
内存使用率 | mem_usage | 实例的内存使用率。 | % | |
磁盘空间使用量 | ins_size | 总使用空间。 | Bytes | |
data_size | 数据磁盘使用空间。 | Bytes | ||
log_size | 日志磁盘使用空间。 | Bytes | ||
连接数使用率 | conn_usage | 实例当前连接数与最大连接数的比值。 | % | |
cursors | open_no_timedout | 当前无超时时间的cursor打开数量。 | 个 | |
open_with_timedout | 当前有超时时间的cursor打开数量。 | 个 | ||
open_total | 当前cursor打开数量。 | 个 | ||
closed_by_timeout | 因超时关闭的cursor数量。 | 个 | ||
closed_by_session | 因关闭会话关闭的cursor数量。 | 个 | ||
读写队列 | currentQueue_total | 排队等待锁的操作总数。 | 个 | |
currentQueue_readers | 排队等待读锁的操作数。 | 个 | ||
currentQueue_writers | 排队等待写锁的操作数。 | 个 | ||
active_readers | 执行读操作的活跃客户端连接数。 | 个 | ||
active_writers | 执行写操作的活跃客户端连接数。 | 个 | ||
平均响应时间(MongoDB_RT) | avg_RT | 实例平均响应时间。 | 微秒 | |
reads_avg_rt | 读操作平均响应时间。 | 微秒 | ||
writes_avg_rt | 写操作平均响应时间。 | 微秒 | ||
commands_avg_rt | 命令操作平均响应时间。 | 微秒 | ||
trans_avg_rt | 事务操作平均响应时间。 | 微秒 | ||
WiredTiger请求队列 | write_concurrent_trans_out | 写并发请求数。 | 个 | |
read_concurrent_trans_out | 读并发请求数。 | 个 | ||
write_concurrent_trans_available | 可用的写并发数。 | 个 | ||
read_concurrent_trans_available | 可用的读并发数。 | 个 | ||
IO延迟 | iocheck_cost: | 当前IO的响应性能。 说明 仅单节点和MongoDB 4.0及以下版本的副本集实例支持。 | 毫秒 | |
WiredTigerCache使用率 | wt_cache_usage | WiredTiger cache使用率。 | % | |
wt_cache_dirty_usage | WiredTiger脏cache使用率。 | % | ||
影响文档数量 | deletedDocuments | 删除的文档数量。 | 个 | |
insertedDocuments | 插入的文档数量。 | 个 | ||
returnDocuments | 返回的文档数量。 | 个 | ||
updatedDocuments | 更新的文档数量。 | 个 | ||
操作详情 | scanAndOrder | 无法使用索引进行sort的请求数。 | 个 | |
writeConflicts | 发生写冲突的次数。 | 个 | ||
exactIDCount | 需要通过广播方式获取匹配_id的信息请求数。 | 个 | ||
查询扫描索引与文档数量 | scannedKeys | 查询扫描索引的数量。 | 个 | |
scannedDocs | 查询扫描文档的数量。 | 个 | ||
TTL | ttlDeletedDocuments | 因TTL索引而删除的文档数量。 | 个 | |
ttlPasses | 后台TTL线程进行删除的次数。 | 个 | ||
Lock Acquisitions | wiredTiger_schema_lock_delta | 模式锁获取次数。 | 个 | |
wiredTiger_metadata_lock_delta | 元数据锁获取次数。 | 个 | ||
wiredTiger_table_read_lock_delta | 表读锁获取次数。 | 个 | ||
wiredTiger_table_write_lock_delta | 表写锁获取次数。 | 个 | ||
wiredTiger_txn_global_read_lock_delta | 事务全局读锁获取次数。 | 个 | ||
wiredTiger_txn_global_write_lock_delta | 事务全局写锁获取次数。 | 个 | ||
MBPS | read_io_bandwidth_mbps | 磁盘读取的吞吐量。 | MB/秒 | |
write_io_bandwidth_mbps | 磁盘写入的吞吐量。 | MB/秒 | ||
io_bandwidth_mbps | 磁盘总吞吐量。 | MB/秒 | ||
事务操作数 | trans_totalPrepared_ps | 已准备好的事务数。 | 个 | |
trans_totalPreparedThenCommited_ps | 已准备好的事务中成功提交的事务。 | 个 | ||
trans_totalPreparedThenAborted_ps | 已准备好的事务中成功回滚的事务数。 | 个 | ||
trans_totalStarted_ps | 已启动的事务数。 | 个 | ||
trans_totalCommited_ps | 成功提交的事务数。 | 个 | ||
trans_totalAborted_ps | 成功回滚的事务数。 | 个 | ||
MBPS使用率 | total_mbps_usage: | 磁盘读写带宽使用率。 说明
| % | |
WiredTiger | bytes_read_into_cache | 读入cache的数据量大小。 | Bytes | |
bytes_written_from_cache | 从cache写的磁盘大小。 | Bytes | ||
maximum_bytes_configured | 配置最大可用的磁盘大小。 | Bytes | ||
磁盘空间使用率 | disk_usage | 实例总使用空间与最大可使用空间的比值。 | % | |
操作QPS数 | insert | 插入操作数。 | 个 | |
query | 查询操作数。 | 个 | ||
update | 更新操作数。 | 个 | ||
delete | 删除操作数。 | 个 | ||
getmore | 读取操作数。 | 个 | ||
command | 协议命令操作数。 | 个 | ||
连接数 | current_conn | 实例当前连接总数。 | 个 | |
active_conn | 实例当前活跃连接数。 | 个 | ||
网络流量 | bytes_in | 进口流量。 | Bytes | |
bytes_out | 出口流量。 | Bytes | ||
| IOPS使用量 | data_iops(iops) | IOPS使用量。 说明
| 次/秒 |
IOPS使用率 | iops_usage | 实例使用IOPS大小与最大可用IOPS的比值。 说明 4.2版本云盘版实例暂不支持查看IOPS使用量和IOPS使用率。 | % | |
主备延迟 | repl_lag | 实例主备节点的数据同步延时信息。 说明
| 秒 | |
分片集群实例 | 分片集群Shard组件操作QPS总数 | insert_primary | 主节点的插入操作数。 | 个 |
query_primary | 主节点的查询操作数。 | 个 | ||
update_primary | 主节点的更新操作数。 | 个 | ||
delete_primary | 主节点的删除操作数。 | 个 | ||
getmore_primary | 主节点的读取操作数。 | 个 | ||
command_primary | 主节点的协议命令操作数。 | 个 | ||
insert_secondary | 从节点的插入操作数。 | 个 | ||
query_secondary | 从节点的查询操作数。 | 个 | ||
insert_hidden | 隐藏节点的插入操作数。 | 个 | ||
query_hidden | 隐藏节的查询操作数。 | 个 | ||
update_hidden | 隐藏节点的更新操作数。 | 个 | ||
delete_hidden | 隐藏节点的删除操作数。 | 个 | ||
getmore_hidden | 隐藏节点的读取操作数。 | 个 | ||
command_hidden | 隐藏节点的协议命令操作数。 | 个 | ||
分片集群Mongos组件操作QPS总数 | insert | 插入操作数。 | 个 | |
query | 查询操作数。 | 个 | ||
update | 更新操作数。 | 个 | ||
delete | 删除操作数。 | 个 | ||
getmore | 读取操作数。 | 个 | ||
command | 协议命令操作数。 | 个 | ||
moveChunk | donorCount | 当前节点作为moveChunk或moveRange源的次数。 | 个 | |
recipientCount | 当前节点作为目标分片接收Chunks的次数。 | 个 |
性能趋势
不同类型实例支持的监控项请以控制台为准。
支持的实例 | 监控项 | 监控指标及说明 |
| CPU使用率 | mongodb.cpu_usage:实例的CPU使用率。 |
内存使用率 | mongodb.mem_usage:实例的内存使用率。 | |
磁盘空间使用量 | 实例磁盘空间的性能趋势,包括:
| |
cursors | 实例cursor数的性能趋势,包括:
| |
WiredTiger请求队列 | 读写请求数以及剩余可用并发数的性能趋势,包括:
说明 仅支持标准版副本集实例。 | |
WiredTiger | 实例WiredTiger引擎cache层指标的性能趋势,包括:
说明 仅支持标准版副本集实例。 | |
| 磁盘空间使用率 | mongodb.disk_usage:mongodb磁盘使用率。 |
操作QPS数 | 实例操作QPS数的性能趋势,包括:
| |
连接数 | mongodb.connections.current:实例当前连接总数。 | |
网络流量 | 实例网络流量的性能趋势,包括:
| |
| IOPS使用量 | IOPS使用量的性能趋势,包括:
|
IOPS使用率 | mongodb.iops_usage:IOPS使用率。 说明 4.2版本副本集云盘版实例以及4.2版本分片集群云盘版实例暂不支持查看IOPS使用量和IOPS使用率。 | |
副本集实例 | GlobalLock | 实例全局锁的性能趋势,包括:
|