本文介绍云数据库MongoDB基本监控和高级监控功能支持的监控项、监控指标及其具体含义。

基本监控和高级监控支持的监控项详情如下:
说明
  • 仅单节点、副本集和分片集群实例支持高级监控
  • 不同类型实例支持的监控项请以控制台为准。
  • 下表中支持代表支持,不支持代表不支持。
支持实例 监控项 基本监控 高级监控 监控项说明
  • 单节点实例
  • 副本集实例
  • 分片集群实例
CPU使用率 支持 支持 cpu_usage:实例的CPU使用率。
内存使用率 支持 支持 mem_usage:实例的内存使用率。
磁盘空间使用量 支持 支持 实例使用的磁盘空间,包括:
  • ins_size:总使用空间。
  • data_size:数据磁盘使用空间。
  • log_size:日志磁盘使用空间。
连接数使用率 不支持 支持 conn_usage:实例当前连接数与最大连接数的比值。
cursors 支持 支持 实例当前使用的cursor数。
  • 基本监控包括:
    • total_open:当前cursor打开数量。
    • timed_out:cursor超时数量。
  • 高级监控包括:
    • open_no_timedout:当前无超时时间的cursor打开数量。
    • open_with_timedout:当前有超时时间的cursor打开数量。
    • open_total:当前cursor打开数量。
    • closed_by_timeout:因超时关闭的cursor数量。
    • closed_by_session:因关闭会话关闭的cursor数量。
读写队列 支持 支持 实例当前等待全局锁的队列长度。
  • 基本监控包括:
    • gl_cq_readers:全局读锁的等待队列长度。
    • gl_cq_writers:全局写锁的等待队列长度。
    • gl_cq_total:所有全局锁的等待队列长度。
  • 高级监控包括:
    • currentQueue_total:所有全局锁的等待队列长度。
    • currentQueue_readers:全局读锁的等待队列长度。
    • currentQueue_writers:全局写锁的等待队列长度。
    • active_readers:当前使用全局读锁数量。
    • active_writers:当前使用全局写锁数量。
平均响应时间 不支持 支持 avgRT:实例平均响应时间。
WiredTiger请求队列 支持 支持 查看当前正在并发的读写请求数以及剩余可用的并发数,包括:
  • write_concurrent_trans_out:写并发请求数。
  • read_concurrent_trans_out:读并发请求数。
  • write_concurrent_trans_available:可用的写并发数。
  • read_concurrent_trans_available:可用的读并发数。
IO延迟 支持
说明 仅单节点和MongoDB 4.0及以下版本的副本集实例支持。
支持 iocheck_cost:当前IO的响应性能。
WiredTigerCache使用率 不支持 支持 实例WiredTiger引擎cache的使用率,包括:
  • wt_cache_usage:WiredTiger cache使用率。
  • wt_cache_dirty_usage:WiredTiger脏cache使用率。
影响文档数量 不支持 支持 实例的文档数量,包括:
  • deletedDocuments:删除的文档数量。
  • insertedDocuments:插入的文档数量。
  • returnDocuments:返回的文档数量。
  • updatedDocuments:更新的文档数量。
操作详情 不支持 支持 实例的操作详情,包括:
  • scanAndOrder:无法使用索引进行sort的请求数。
  • writeConflicts:发生写冲突的次数。
  • exactIDCount:需要通过广播方式获取匹配_id的信息请求数。
查询扫描索引与文档数量 不支持 支持 查询扫描索引和文档的数量,包括:
  • scannedKeys:查询扫描索引的数量。
  • scannedDocs:查询扫描文档的数量。
TTL 不支持 支持 实例的TTL操作,包括:
  • ttlDeletedDocuments:因TTL索引而删除的文档数量。
  • ttlPasses:后台TTL线程进行删除的次数。
WiredTiger 支持 不支持 实例WiredTiger引擎cache层指标,包括:
  • bytes_read_into_cache:读入cache的数据量大小。
  • bytes_written_from_cache:从cache写的磁盘大小。
  • maximum_bytes_configured:配置最大可用的磁盘大小。
  • 单节点实例
  • 副本集实例
  • 分片集群实例
  • Serverless实例
磁盘空间使用率 支持 支持
说明 Serverless实例不支持该监控项。
disk_usage:实例总使用空间与最大可使用空间的比值。
操作QPS数 支持 支持
说明 Serverless实例不支持该监控项。
实例的操作QPS数,包括:
  • insert:插入操作数。
  • query:查询操作数。
  • update:更新操作数。
  • delete:删除操作数。
  • getmore:读取操作数。
  • command:协议命令操作数。
连接数 支持 支持
说明 Serverless实例不支持该监控项。
实例连接个数,包括:
  • current_conn:实例当前连接总数。
  • active_conn:实例当前活跃连接数。
    说明 高级监控不支持该参数。
网络流量 支持 支持
说明 Serverless实例不支持该监控项。
实例的网络流量,包括:
  • bytes_in:进口流量。
  • bytes_out:出口流量。
  • num_requests:处理的请求数。
  • 副本集实例
  • 分片集群实例
IOPS使用量 支持 支持 IOPS使用量,包括:
  • data_iops:数据盘IOPS。
  • log_iops:日志盘IOPS。
IOPS使用率 支持 支持 iops_usage:实例使用IOPS大小与最大可用IOPS的比值。
主备延迟 支持 支持 repl_lag:实例主备节点的数据同步延时信息。
说明 由于副本集之间的心跳间隔是2s,故副本集实例、分片集群实例的Shard节点和ConfigServer节点的repl_lag取值在-2~2之间,均正常。
Serverless实例 每次访问个数 支持 不支持 sl_qps:实例的每秒访问次数。
分片集群实例 分片集群Shard组件操作QPS总数 不支持 支持 实例Shard组件的操作QPS总数,包括:
  • insert_primary:插入主节点操作数。
  • query_primary:查询主节点操作数。
  • update_primary:更新主节点操作数。
  • delete_primary:删除主节点操作数。
  • getmore_primary:读取主节点操作数。
  • command_primary:协议命令主节点操作数。
  • insert_secondary:插入从节点操作数。
  • query_secondary:查询从节点操作数。
  • insert_hidden:插入隐藏节点操作数。
  • query_hidden:查询隐藏节点操作数。
  • update_hidden:更新隐藏节点操作数。
  • delete_hidden:删除隐藏节点操作数。
  • getmore_hidden:读取隐藏节点操作数。
  • command_hidden:协议命令隐藏节点操作数。
分片集群Mongos组件操作QPS总数 不支持 支持 实例Mongos组件的操作QPS总数,包括:
  • insert:插入操作数。
  • query:查询操作数。
  • update:更新操作数。
  • delete:删除操作数。
  • getmore:读取操作数。
  • command:协议命令操作数。
moveChunk 不支持 支持 当前节点作为moveChunk源或目标的次数,包括:
  • donorCount:当前节点作为moveChunk源的次数。
  • recipientCount:当前节点作为moveChunk目标的次数。