监控项说明

本文介绍云数据库MongoDB基本监控、高级监控和性能趋势功能支持的监控项、监控指标及其具体含义。

基础监控

说明

不同类型实例支持的监控项请以控制台为准。

监控项

key

指标名

指标含义

支持的实例类型

磁盘空间使用率

DiskUsage

disk_usage

实例的磁盘使用率。

  • 单节点实例

  • 副本集实例

  • 分片集群实例

  • Serverless实例

网络流量

MongoDB_Network

bytes_in

实例的网络进口流量。

bytes_out

实例的网络出口流量。

num_requests

实例处理的请求数。

操作QPS

MongoDB_Opcounters

insert

实例的插入操作QPS数。

query

实例的查询操作QPS数。

update

实例的更新操作QPS数。

delete

实例的删除操作QPS数。

getmore

实例的读取操作QPS数。

command

实例的协议命令操作QPS数。

连接数

MongoDB_TotalConns

connections_active

实例当前活跃连接数。

current_conn

实例当前连接数。

connections_totalCreated_ps

实例每秒新建连接的总数。

  • 单节点实例

  • 副本集实例

  • 分片集群实例

connections_available

实例当前可用的连接数。

连接数使用率

ConnectionUsage

conn_usage

实例的连接数使用率。

CPU使用率

CpuUsage

cpu_usage

实例的CPU使用率。

内存使用率

MemoryUsage

mem_usage

实例的内存使用率。

IOPS使用量

MongoDB_IOPS

iops

IOPS使用量。

说明
  • 4.2版本副本集云盘版实例以及4.2版本分片集群云盘版实例暂不支持查看IOPS使用量和IOPS使用率。

  • 旧版本监控中的data_iopslog_iops现合并为iops。

IOPS使用率

IOPSUsage

iops_usage

实例的IOPS使用率。

说明

4.2版本副本集云盘版实例以及4.2版本分片集群云盘版实例暂不支持查看IOPS使用量和IOPS使用率。

磁盘空间使用量

MongoDB_DetailedSpaceUsage

ins_size

实例的磁盘使用空间。

data_size

数据磁盘使用空间(不包括local库),主要包括collection开头的数据物理⽂件,索引开头的索引物理⽂件和部分元数据物理⽂件,例如WiredTiger.wt。

log_size

local库的物理大小、mongodb运行日志大小和部分审计日志大小。

操作详情

MongoDB_OperationDetails

operation_exactIDCount_ps

针对特定ID进行计数操作的次数。

operation_scanAndOrder_ps

未用索引的排序操作数。

operation_writeConflicts_ps

发生写冲突的次数。

MBPS

MongoDB_Disk_Detail

read_io_bandwidth_mbps

磁盘读取的吞吐量。

write_io_bandwidth_mbps

磁盘写入的吞吐量。

io_bandwidth_mbps

磁盘总吞吐量。

事务操作数

MongoDB_Transactions

trans_totalPrepared_ps

已准备好的事务数。

trans_totalPreparedThenCommited_ps

已准备好的事务中成功提交的事务数。

trans_totalPreparedThenAborted_ps

已准备好的事务中成功回滚的事务数。

trans_totalStarted_ps

已启动的事务数。

trans_totalCommited_ps

成功提交的事务数。

trans_totalAborted_ps

成功回滚的事务数。

Cursors

MongoDB_AllCursors

total_open

实例当前打开的Cursor数量。

timed_out

实例因超时关闭的Cursor数量。

job_cursors_closed

实例因关闭会话关闭的Cursor数量。

pinned_open

实例当前打开且超时的Cursor数量。

noTimeout_open

实例当前打开且未超时的Cursor数量。

  • 单节点实例

  • 副本集实例

  • 分片集群实例(仅支持ShardConfigServer)

WiredTiger

MongoDB_Wt_Cache

bytes_read_into_cache

读入缓存的字节数。

bytes_written_from_cache

从缓存写出的字节数。

maximum_bytes_configured

最大缓存大小。

WT并发事务数

MongoDB_Wt_Concurrent_Trans

write_concurrent_trans_out

当前写并发事务数。

write_concurrent_trans_available

可用的写并发事务数。

read_concurrent_trans_out

当前读并发事务数。

read_concurrent_trans_available

可用的读并发事务数。

WiredTigerUsage

MongoDB_WTCacheUsage

wt_cache_dirty_usage

WiredTiger脏缓存使用率。

wt_cache_usage

WiredTiger缓存使用率。

平均响应时间

MongoDB_RT

avg_rt

实例平均响应时间。

reads_avg_rt

读操作平均响应时间。

writes_avg_rt

写操作平均响应时间。

commands_avg_rt

命令操作平均响应时间。

trans_avg_rt

事务操作平均响应时间。

影响文档数量

MongoDB_Documents

document_deleted_ps

实例删除的文档数量。

document_inserted_ps

实例插入的文档数量。

document_returned_ps

实例返回的文档数量。

document_updated_ps

实例更新的文档数量。

GlobalLock

MongoDB_GlobalLocks

gl_ac_readers

执行读操作的活跃客户端连接数。

gl_ac_writers

执行写操作的活跃客户端连接数。

gl_cq_writers

排队等待写锁的操作数。

gl_cq_readers

排队等待读锁的操作数。

gl_cq_total

排队等待锁定的操作总数。

查询扫描索引与文档数量

MongoDB_QueryExecutors

queryExecutor_scannedObject_ps

查询扫描文档的数量。

queryExecutor_scanned_ps

查询扫描索引的数量。

TTL

MongoDB_TTLs

ttl_deletedDocuments_ps

TTL索引而删除的文档数量。

ttl_passes_ps

后台TTL线程进行删除的次数。

Repl Opcounters

MongoDB_ReplOpcounters

repl_command

复制集中Command命令的操作数。

repl_delete

复制集中Delete命令的操作数。

repl_getmore

复制集中Getmore命令的操作数。

repl_insert

复制集中Insert命令的操作数。

repl_query

复制集中Query命令的操作数。

repl_update

复制集中Update命令的操作数。

Eviction扫描数

MongoDB_WtCacheHPCheckEntriesWalked

wiredTiger_cache_hazardPointerCheckEntriesWalked

Eviction时扫描hazard pointer array的内容的数量。

Lock Acquisitions

MongoDB_WtLockAcquisitions

wt_checkPoint_lock

检查点锁获取次数。

wt_dhandle_read_lock

数据句柄读锁获取次数。

wt_dhandle_write_lock

数据句柄写锁获取次数。

wt_metadata_lock

元数据锁获取次数。

wt_schema_lock

模式锁获取次数。

wt_table_read_lock

表读锁获取次数。

wt_table_write_lock

表写锁获取次数。

wt_txn_global_read_lock

事务全局读锁获取次数。

wt_txn_global_write_lock

事务全局写锁获取次数。

主备延时

MongoDB_Repl_Lag

repl_lag

实例主备节点的数据同步延时。

说明
  • 由于副本集之间的心跳间隔是2s,所以副本集实例、分片集群实例的Shard节点和ConfigServer节点的repl_lag取值在-22之间时均正常。

  • 备节点的repl_lag可能为负值,并不代表该备节点领先于主节点。如需获取副本集主备延迟的最新状态,请在主节点上运行rs.printSecondaryReplicationInfo()

  • 副本集实例

  • 分片集群实例(仅支持ShardConfigServer)

Oplog保留时长

MongoDB_OplogTimeInterval

oplog_time_interval

Oplog保留时长。

moveChunk

MongoDB_MoveChunks

moveChunk_donor_started_ps

当前节点作为范围迁移源的次数。

  • 分片集群实例(仅支持ShardMongos)

moveChunk_recip_stared_ps

当前节点作为范围迁移目标的次数。

每次访问个数

-

sl_qps

实例的每秒访问次数。

  • Serverless实例

高级监控

说明
  • 仅单节点、副本集和分片集群实例支持高级监控

  • 不同类型实例支持的监控项请以控制台为准。

支持的实例

监控项

监控指标及说明

  • 单节点实例

  • 副本集实例

  • 分片集群实例

CPU使用率

cpu_usage:实例的CPU使用率。

内存使用率

mem_usage:实例的内存使用率。

磁盘空间使用量

实例使用的磁盘空间,包括:

  • ins_size:总使用空间。

  • data_size:数据磁盘使用空间。

  • log_size:日志磁盘使用空间。

连接数使用率

conn_usage:实例当前连接数与最大连接数的比值。

cursors

实例当前使用的cursor数,包括:

  • open_no_timedout:当前无超时时间的cursor打开数量。

  • open_with_timedout:当前有超时时间的cursor打开数量。

  • open_total:当前cursor打开数量。

  • closed_by_timeout:因超时关闭的cursor数量。

  • closed_by_session:因关闭会话关闭的cursor数量。

读写队列

实例当前等待全局锁的数量,包括:

  • currentQueue_total:排队等待锁的操作总数。

  • currentQueue_readers:排队等待读锁的操作数。

  • currentQueue_writers:排队等待写锁的操作数。

  • active_readers:执行读操作的活跃客户端连接数。

  • active_writers:执行写操作的活跃客户端连接数。

平均响应时间

avgRT:实例平均响应时间。

WiredTiger请求队列

查看当前正在并发的读写请求数以及剩余可用的并发数,包括:

  • write_concurrent_trans_out:写并发请求数。

  • read_concurrent_trans_out:读并发请求数。

  • write_concurrent_trans_available:可用的写并发数。

  • read_concurrent_trans_available:可用的读并发数。

IO延迟

iocheck_cost:当前IO的响应性能。

说明

仅单节点和MongoDB 4.0及以下版本的副本集实例支持。

WiredTigerCache使用率

实例WiredTiger引擎cache的使用率,包括:

  • wt_cache_usage:WiredTiger cache使用率。

  • wt_cache_dirty_usage:WiredTigercache使用率。

影响文档数量

实例的文档数量,包括:

  • deletedDocuments:删除的文档数量。

  • insertedDocuments:插入的文档数量。

  • returnDocuments:返回的文档数量。

  • updatedDocuments:更新的文档数量。

操作详情

实例的操作详情,包括:

  • scanAndOrder:无法使用索引进行sort的请求数。

  • writeConflicts:发生写冲突的次数。

  • exactIDCount:需要通过广播方式获取匹配_id的信息请求数。

查询扫描索引与文档数量

查询扫描索引和文档的数量,包括:

  • scannedKeys:查询扫描索引的数量。

  • scannedDocs:查询扫描文档的数量。

TTL

实例的TTL操作,包括:

  • ttlDeletedDocuments:因TTL索引而删除的文档数量。

  • ttlPasses:后台TTL线程进行删除的次数。

  • 单节点实例

  • 副本集实例

  • 分片集群实例

  • Serverless实例

磁盘空间使用率

disk_usage:实例总使用空间与最大可使用空间的比值。

说明

Serverless实例不支持该监控项。

操作QPS

实例的操作QPS数,包括:

  • insert:插入操作数。

  • query:查询操作数。

  • update:更新操作数。

  • delete:删除操作数。

  • getmore:读取操作数。

  • command:协议命令操作数。

说明

Serverless实例不支持该监控项。

连接数

实例的连接数,包括:

  • current_conn:实例当前连接总数。

  • active_conn:实例当前活跃连接数。

说明

Serverless实例不支持该监控项。

网络流量

实例的网络流量,包括:

  • bytes_in:进口流量。

  • bytes_out:出口流量。

说明

Serverless实例不支持该监控项。

  • 副本集实例

  • 分片集群实例

IOPS使用量

data_iops(iops):IOPS使用量。

说明
  • 4.2版本副本集云盘版实例以及4.2版本分片集群云盘版实例暂不支持查看IOPS使用量和IOPS使用率。

  • 旧版本监控中的data_iopslog_iops现合并为data_iops(iops)。

IOPS使用率

iops_usage:实例使用IOPS大小与最大可用IOPS的比值。

说明

4.2版本副本集云盘版实例以及4.2版本分片集群云盘版实例暂不支持查看IOPS使用量和IOPS使用率。

主备延迟

repl_lag:实例主备节点的数据同步延时信息。

说明
  • 由于副本集之间的心跳间隔是2s,所以副本集实例、分片集群实例的Shard节点和ConfigServer节点的repl_lag取值在-22之间时均正常。

  • 备节点的repl_lag可能为负值,并不代表该备节点领先于主节点。如需获取副本集主备延迟的最新状态,请在主节点上运行rs.printSecondaryReplicationInfo()

分片集群实例

分片集群Shard组件操作QPS总数

实例Shard组件的操作QPS总数,包括:

  • insert_primary:插入主节点操作数。

  • query_primary:查询主节点操作数。

  • update_primary:更新主节点操作数。

  • delete_primary:删除主节点操作数。

  • getmore_primary:读取主节点操作数。

  • command_primary:协议命令主节点操作数。

  • insert_secondary:插入从节点操作数。

  • query_secondary:查询从节点操作数。

  • insert_hidden:插入隐藏节点操作数。

  • query_hidden:查询隐藏节点操作数。

  • update_hidden:更新隐藏节点操作数。

  • delete_hidden:删除隐藏节点操作数。

  • getmore_hidden:读取隐藏节点操作数。

  • command_hidden:协议命令隐藏节点操作数。

分片集群Mongos组件操作QPS总数

实例Mongos组件的操作QPS总数,包括:

  • insert:插入操作数。

  • query:查询操作数。

  • update:更新操作数。

  • delete:删除操作数。

  • getmore:读取操作数。

  • command:协议命令操作数。

moveChunk

当前节点作为moveChunk源或目标的次数,包括:

  • donorCount:当前节点作为moveChunkmoveRange源的次数。

  • recipientCount:当前节点作为目标分片接收Chunks的次数。

性能趋势

说明

不同类型实例支持的监控项请以控制台为准。

支持的实例

监控项

监控指标及说明

  • 单节点实例

  • 副本集实例

  • 分片集群实例

CPU使用率

mongodb.cpu_usage:实例的CPU使用率。

内存使用率

mongodb.mem_usage:实例的内存使用率。

磁盘空间使用量

实例磁盘空间的性能趋势,包括:

  • mongodb.detailed_space_usage.ins_size:总使用空间。

  • mongodb.detailed_space_usage.data_size:数据磁盘使用空间。

  • mongodb.detailed_space_usage.log_size:日志磁盘使用空间。

cursors

实例cursor数的性能趋势,包括:

  • mongodb.metrics.cursor.timedOut:cursor超时数量。

  • mongodb.metrics.cursor.open.total:当前cursor打开数量。

WiredTiger请求队列

读写请求数以及剩余可用并发数的性能趋势,包括:

  • mongodb.wiredTiger.write_concurrent_trans_out:写并发请求数。

  • mongodb.wiredTiger.read_concurrent_trans_out:读并发请求数。

  • mongodb.wiredTiger.write_concurrent_trans_available:可用的写并发数。

  • mongodb.wiredTiger.read_concurrent_trans_available:可用的读并发数。

说明

仅支持标准版副本集实例。

WiredTiger

实例WiredTiger引擎cache层指标的性能趋势,包括:

  • mongodb.wiredTiger.cache.pages.read.into.cache:读入cache的数据量大小。

  • mongodb.wiredTiger.cache.pages.written.from.cache:从cache写入的磁盘大小。

  • mongodb.wiredTiger.cache.maximum.bytes.configured:配置最大可用的磁盘大小。

说明

仅支持标准版副本集实例。

  • 单节点实例

  • 副本集实例

  • 分片集群实例

  • Serverless实例

磁盘空间使用率

mongodb.disk_usage:mongodb磁盘使用率。

操作QPS

实例操作QPS数的性能趋势,包括:

  • mongodb.opcounters.insert:插入操作数。

  • mongodb.opcounters.query:查询操作数。

  • mongodb.opcounters.update:更新操作数。

  • mongodb.opcounters.delete:删除操作数。

  • mongodb.opcounters.getmore:读取操作数。

  • mongodb.opcounters.command:协议命令操作数。

连接数

mongodb.connections.current:实例当前连接总数。

网络流量

实例网络流量的性能趋势,包括:

  • mongodb.network.bytesIn:进口流量。

  • mongodb.network.bytesOut:出口流量。

  • mongodb.network.numRequests:处理的请求数。

  • 副本集实例

  • 分片集群实例

IOPS使用量

IOPS使用量的性能趋势,包括:

  • mongodb.iops.data_iops:数据盘读写次数。

  • mongodb.iops.log_iops:日志盘读写次数。

IOPS使用率

mongodb.iops_usage:IOPS使用率。

说明

4.2版本副本集云盘版实例以及4.2版本分片集群云盘版实例暂不支持查看IOPS使用量和IOPS使用率。

副本集实例

GlobalLock

实例全局锁的性能趋势,包括:

  • mongodb.globalLock.currentQueue.total:全局锁队列总长度。

  • mongodb.globalLock.currentQueue.writers:全局锁写队列总长度。

  • mongodb.globalLock.currentQueue.readers:全局锁读队列总长度。