可观测监控 Prometheus 版按照指标上报次数收费。指标分为两种类型:基础指标和自定义指标,非基础指标的即是自定义指标。其中,基础指标不收费,自定义指标于2020年01月06日开始收费。

容器集群

可观测监控 Prometheus 版支持的容器集群基础指标如下所示。

Prometheus状态信息的任务名称和基础指标

任务名称(Job Name)指标类型指标名称指标说明
_arms-prom/kubelet/1基础指标promhttp_metric_handler_requests_in_flight-
go_memstats_mallocs_total是一个计数器值,用于显示有多少堆对象进行分配了。可以使用rate()函数来计算堆对象分配速率。
go_memstats_lookups_total是一个计数器值,用于计算有多少指针解引用。可以使用rate()函数来计算指针解引用速率。
go_memstats_last_gc_time_seconds上一次GC完成时的时间戳。
go_memstats_heap_sys_bytes该指标显示从操作系统中为堆分配的内存字节数。它包括已保留但尚未使用的虚拟地址空间
go_memstats_heap_released_bytes显示有多少空闲Span已归还操作系统。
go_memstats_heap_objects显示有多少对象是堆上在分配的,会随着GC和新对象的分配而改变。
go_memstats_heap_inuse_bytes显示正在使用的Span占用字节数。
go_memstats_heap_idle_bytes显示空闲Span占用的内存字节数。
go_memstats_heap_alloc_bytes该指标展示了在堆上为对象分配了多少字节的内存。该指标包括所有可达(reachable)堆对象和不可达(unreachable)对象(GC尚未释放的)占用的内存大小。
go_memstats_gc_sys_bytes显示垃圾收集元数据占用内存大小。
go_memstats_gc_cpu_fraction显示自程序启动以来,GC所占用CPU时间的比例。
go_memstats_frees_total是一个计数器值,用于显示有多个堆对象被释放。可以使用rate()函数计算堆对象释放速率。同时可以通过go_memstats_mallocs_total -go_memstats_frees_total得到存活的堆对象数量。
go_memstats_buck_hash_sys_bytes显示用于Profiling的哈希表占用的内存大小。
go_memstats_alloc_bytes_total该指标随着对象在堆中分配而增加,但在释放对象时并不会减少。类似Prometheus的计数器类型,对该指标可以使用rate()来获取内存消耗速度。
go_memstats_alloc_bytes该指标展示了在上为对象分配了多少字节的内存。该指标包括所有可达(reachable)堆对象和不可达(unreachable)对象(GC尚未释放的)占用的内存大小。
scrape_duration_seconds-
go_info该指标提供了Go版本信息。该指标数据来自runtime.Version()
go_goroutines通过runtime.NumGoroutine()调用获取,基于调度器结构sched和全局allglen变量计算得来。由于sched结构体的所有字段可能并发的更改,因此最后会检查计算的值是否小于1,如果小于1,那么返回1。
scrape_samples_post_metric_relabeling-
go_gc_duration_seconds_sum-
go_gc_duration_seconds_count-
blackbox_exporter_config_last_reload_successful-
blackbox_exporter_config_last_reload_success_timestamp_seconds-
scrape_samples_scraped-
blackbox_exporter_build_info-
arms_prometheus_target_scrapes_sample_out_of_order_total-
arms_prometheus_target_scrapes_sample_out_of_bounds_total-
arms_prometheus_target_scrapes_sample_duplicate_timestamp_total-
scrape_series_added-
arms_prometheus_target_scrapes_exceeded_sample_limit_total-
arms_prometheus_target_scrapes_cache_flush_forced_total_arms-prom/kubelet/1-
arms_prometheus_target_scrape_pools_total-
statsd_metric_mapper_cache_gets_total-
statsd_metric_mapper_cache_hits_total-
statsd_metric_mapper_cache_length-
arms_prometheus_target_scrape_pools_failed_total-
up-
arms_prometheus_target_scrape_pool_reloads_total-
arms_prometheus_target_scrape_pool_reloads_failed_total-

API Server任务类型(Job)的任务名称和基础指标

任务名称(Job Name)指标类型指标名称
apiserver基础指标apiserver_request_duration_seconds_bucket(默认废弃)
apiserver_admission_controller_admission_duration_seconds_bucket
apiserver_request_total
rest_client_requests_total
apiserver_admission_webhook_admission_duration_seconds_bucket
apiserver_current_inflight_requests
up
apiserver_admission_webhook_admission_duration_seconds_count
scrape_samples_post_metric_relabeling
scrape_samples_scraped
scrape_series_added
scrape_duration_seconds

Ingress任务类型(Job)的任务名称和基础指标

任务名称(Job Name)指标类型指标名称指标说明
arms-ack-ingress基础指标nginx_ingress_controller_request_duration_seconds_bucket-
nginx_ingress_controller_response_duration_seconds_bucket(默认废弃)-
nginx_ingress_controller_response_size_bucket(默认废弃)-
nginx_ingress_controller_request_size_bucket-
nginx_ingress_controller_bytes_sent_bucket-
go_gc_duration_seconds数据来自调用debug.ReadGCStats(),调用该函数时,会将传入参数GCStats结构体的PauseQuantile字段设置为5,这样函数将会返回最小、25%、50%、75% 和最大这5个GC暂停时间百分位数。然后prometheus Go客户端根据返回的GC暂停时间百分位数、以及NumGC和PauseTotal变量创建摘要类型指标。
nginx_ingress_controller_nginx_process_connections-
nginx_ingress_controller_request_duration_seconds_sum-
nginx_ingress_controller_request_duration_seconds_count(默认废弃)-
nginx_ingress_controller_bytes_sent_sum-
nginx_ingress_controller_request_size_sum-
nginx_ingress_controller_response_duration_seconds_count-
nginx_ingress_controller_response_duration_seconds_sum(默认废弃)-
nginx_ingress_controller_response_size_count(默认废弃)-
nginx_ingress_controller_bytes_sent_count-
nginx_ingress_controller_response_size_sum-
nginx_ingress_controller_request_size_count-
promhttp_metric_handler_requests_total-
nginx_ingress_controller_nginx_process_connections_total-
go_memstats_mcache_sys_bytes显示从操作系统分配的,用于mcache结构体的内存大小。
go_memstats_lookups_total是一个计数器值,用于计算有多少指针解引用。可以使用rate()函数来计算指针解引用速率。
go_threads通过runtime.CreateThreadProfile()调用获取,读取的是全局allm变量。
go_memstats_sys_bytes该指标用于衡量Go从系统中总共获取了多少字节的内存。
go_memstats_last_gc_time_seconds上一次GC完成时的时间戳。
go_memstats_heap_sys_bytes该指标显示从操作系统中为堆分配的内存字节数。它包括已保留但尚未使用的虚拟地址空间
go_memstats_heap_objects显示有多少对象是堆上在分配的,会随着GC和新对象的分配而改变。
go_memstats_heap_inuse_bytes显示正在使用的Span占用字节数。
go_memstats_heap_idle_bytes显示空闲Span占用的内存字节数。
go_memstats_heap_alloc_bytes该指标展示了在堆上为对象分配了多少字节的内存。该指标包括所有可达(reachable)堆对象和不可达(unreachable)对象(GC尚未释放的)占用的内存大小。
go_memstats_gc_sys_bytes显示垃圾收集元数据占用内存大小。
promhttp_metric_handler_requests_in_flight-
go_memstats_stack_sys_bytes显示从操作系统中获得多少字节的栈内存。是go_memstats_stack_inuse_bytes 加上操作系统线程栈得到。
go_memstats_stack_inuse_bytes显示栈内存Span上已使用的内存大小,该Span上面至少分配了一个栈对象。
go_memstats_gc_cpu_fraction显示自程序启动以来,GC所占用CPU时间的比例。
go_memstats_frees_total是一个计数器值,用于显示有多个堆对象被释放。可以使用rate()函数计算堆对象释放速率。同时可以通过go_memstats_mallocs_total - go_memstats_frees_total得到存活的堆对象数量。
go_memstats_buck_hash_sys_bytes显示用于Profiling的哈希表占用的内存大小。
go_memstats_alloc_bytes_total该指标随着对象在堆中分配而增加,但在释放对象时并不会减少。类似Prometheus的计数器类型,对该指标可以使用rate()来获取内存消耗速度。
go_memstats_alloc_bytes该指标展示了在堆上为对象分配了多少字节的内存。该指标包括所有可达(reachable)堆对象和不可达(unreachable)对象(GC尚未释放的)占用的内存大小。
nginx_ingress_controller_nginx_process_num_procs-
go_info该指标提供了Go版本信息。该指标数据来自runtime.Version()
go_memstats_mallocs_total是一个计数器值,用于显示有多少堆对象进行分配了。可以使用rate()函数来计算堆对象分配速率。
go_memstats_other_sys_bytes显示用于其他运行时分配占用内存大小。
go_goroutines通过runtime.NumGoroutine()调用获取,基于调度器结构sched和全局allglen变量计算得来。由于sched结构体的所有字段可能并发的更改,因此最后会检查计算的值是否小于1,如果小于1,那么返回1。
scrape_samples_post_metric_relabeling-
scrape_samples_scraped-
process_virtual_memory_max_bytes-
process_virtual_memory_bytes即VSS(Virtual Set Size),指虚拟内存集,是全部分配的内存,包括分配但未使用的内存、共享内存、换出的内存。
scrape_duration_seconds-
go_memstats_heap_released_bytes显示有多少空闲Span已归还操作系统。
go_gc_duration_seconds_sum-
go_memstats_next_gc_bytes显示下个GC循环时候,堆占用内存大小。GC的目标是保证go_memstats_heap_alloc_bytes小于此值。
go_gc_duration_seconds_count-
nginx_ingress_controller_config_hash-
nginx_ingress_controller_config_last_reload_successful-
nginx_ingress_controller_config_last_reload_successful_timestamp_seconds-
nginx_ingress_controller_ingress_upstream_latency_seconds_count-
nginx_ingress_controller_ingress_upstream_latency_seconds_sum-
process_start_time_seconds使用到start_timestart_time描述了进程启动时的时间,单位是jiffies,数据来自/proc/stat。最后将start_time除以USER_HZ得到以秒为单位的值。
nginx_ingress_controller_nginx_process_cpu_seconds_total-
scrape_series_added-
nginx_ingress_controller_nginx_process_oldest_start_time_seconds-
nginx_ingress_controller_nginx_process_read_bytes_total-
nginx_ingress_controller_nginx_process_requests_total-
nginx_ingress_controller_nginx_process_resident_memory_bytes-
nginx_ingress_controller_nginx_process_virtual_memory_bytes-
nginx_ingress_controller_nginx_process_write_bytes_total-
nginx_ingress_controller_requests-
go_memstats_mcache_inuse_bytes显示mcache结构体使用的内存大小。
nginx_ingress_controller_success-
process_resident_memory_bytes即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换出的内存页面,但包含共享内存。
process_open_fds通过计算/proc/PID/fd目录下的文件总数得来。显示了Go进程当前打开的常规文件、套接字、伪终端总数。
process_max_fds读取/proc/{PID}/limits 文件中,Max Open Files所在行的值获得,该值是软限制(Soft Limit),软限制是内核为相应资源强制执行的值,而硬限制(Hard Limit)充当软限制的上限。
process_cpu_seconds_total该指标计算使用到utime(Go进程执行在用户态模式下的滴答数)和stime(Go进程执行在内核态时候的滴答数,例如系统调用时),他们的单位jiffies,jiffy 描述了两次系统定时器中断之间的滴答时间。process_cpu_seconds_total等于utime和stime之和除以USER_HZ。即将程序滴答总数除以 Hz(每秒滴答数)得到就是操作系统运行该进程的总时间(以秒为单位)。
go_memstats_mspan_sys_bytes显示从操作系统中分配的,用于mspan结构体的内存大小。
up-
go_memstats_mspan_inuse_bytes显示mspan结构体使用的内存大小。
nginx_ingress_controller_ssl_expire_time_seconds-
nginx_ingress_controller_leader_election_status-

CoreDNS任务类型(Job)的任务名称和基础指标

任务名称(Job Name)指标类型指标名称指标说明
arms-ack-coredns基础指标coredns_forward_request_duration_seconds_bucket-
coredns_dns_request_size_bytes_bucket-
coredns_dns_response_size_bytes_bucket-
coredns_kubernetes_dns_programming_duration_seconds_bucket-
coredns_dns_request_duration_seconds_bucket-
coredns_plugin_enabled-
coredns_health_request_duration_seconds_bucket-
go_gc_duration_seconds数据来自调用debug.ReadGCStats(),调用该函数时,会将传入参数GCStats结构体的PauseQuantile字段设置为5,这样函数将会返回最小、25%、50%、75% 和最大这5个GC暂停时间百分位数。然后prometheus Go客户端根据返回的GC暂停时间百分位数、以及NumGC和PauseTotal变量创建摘要类型指标。
coredns_forward_responses_total-
coredns_forward_request_duration_seconds_sum-
coredns_forward_request_duration_seconds_count-
coredns_dns_requests_total-
coredns_forward_conn_cache_misses_total-
coredns_dns_responses_total-
coredns_cache_entries-
coredns_cache_hits_total-
coredns_forward_conn_cache_hits_total-
coredns_forward_requests_total-
coredns_dns_request_size_bytes_sum-
coredns_dns_response_size_bytes_count-
coredns_dns_response_size_bytes_sum-
coredns_dns_request_size_bytes_count-
scrape_duration_seconds-
scrape_samples_scraped-
scrape_series_added-
up-
scrape_samples_post_metric_relabeling-
go_memstats_lookups_total是一个计数器值,用于计算有多少指针解引用。可以使用rate()函数来计算指针解引用速率。
go_memstats_last_gc_time_seconds上一次GC完成时的时间戳。
go_memstats_heap_sys_bytes该指标显示从操作系统中为堆分配的内存字节数。它包括已保留但尚未使用的虚拟地址空间
coredns_build_info-
go_memstats_heap_released_bytes显示有多少空闲Span已归还操作系统。
go_memstats_heap_objects显示有多少对象是堆上在分配的,会随着GC和新对象的分配而改变。
go_memstats_heap_inuse_bytes显示正在使用的Span占用字节数。
go_memstats_heap_idle_bytes显示空闲Span占用的内存字节数。
go_memstats_heap_alloc_bytes该指标展示了在堆上为对象分配了多少字节的内存。该指标包括所有可达(reachable)堆对象和不可达(unreachable)对象(GC尚未释放的)占用的内存大小。
go_memstats_gc_sys_bytes显示垃圾收集元数据占用内存大小。
go_memstats_sys_bytes该指标用于衡量Go从系统中总共获取了多少字节的内存。
go_memstats_stack_sys_bytes显示从操作系统中获得多少字节的栈内存。是go_memstats_stack_inuse_bytes 加上操作系统线程栈得到。
go_memstats_mallocs_total是一个计数器值,用于显示有多少堆对象进行分配了。可以使用rate()函数来计算堆对象分配速率。
go_memstats_gc_cpu_fraction显示自程序启动以来,GC所占用CPU时间的比例。
go_memstats_stack_inuse_bytes显示栈内存Span上已使用的内存大小,该Span上面至少分配了一个栈对象。
go_memstats_frees_total是一个计数器值,用于显示有多个堆对象被释放。可以使用rate()函数计算堆对象释放速率。同时可以通过go_memstats_mallocs_total - go_memstats_frees_total得到存活的堆对象数量。
go_memstats_buck_hash_sys_bytes显示用于Profiling的哈希表占用的内存大小。
go_memstats_alloc_bytes_total该指标随着对象在堆中分配而增加,但在释放对象时并不会减少。类似Prometheus的计数器类型,对该指标可以使用rate()来获取内存消耗速度。
go_memstats_alloc_bytes该指标展示了在 上为对象分配了多少字节的内存。该值与go_memstats_heap_alloc_bytes相同。该指标包括所有可达(reachable)堆对象和不可达(unreachable)对象(GC尚未释放的)占用的内存大小。
coredns_cache_misses_total-
go_memstats_other_sys_bytes显示用于其他运行时分配占用内存大小。
go_memstats_mcache_inuse_bytes显示mcache结构体使用的内存大小。
go_goroutines通过runtime.NumGoroutine()调用获取,基于调度器结构sched和全局allglen变量计算得来。由于sched结构体的所有字段可能并发的更改,因此最后会检查计算的值是否小于1,如果小于1,那么返回1。
process_virtual_memory_max_bytes-
process_virtual_memory_bytes即VSS(Virtual Set Size),指虚拟内存集,是全部分配的内存,包括分配但未使用的内存、共享内存、换出的内存。
go_gc_duration_seconds_sum-
go_gc_duration_seconds_countarms-ack-coredns-
go_memstats_next_gc_bytes显示下个GC循环时候,堆占用内存大小。GC的目标是保证go_memstats_heap_alloc_bytes小于此值。
coredns_dns_request_duration_seconds_count-
coredns_reload_failed_total-
coredns_panics_total-
coredns_local_localhost_requests_total-
coredns_kubernetes_dns_programming_duration_seconds_sum-
coredns_kubernetes_dns_programming_duration_seconds_count-
coredns_dns_request_duration_seconds_sum-
coredns_hosts_reload_timestamp_seconds-
oredns_health_request_failures_total-
process_start_time_seconds使用到start_timestart_time描述了进程启动时的时间,单位是jiffies,数据来自/proc/stat。最后将start_time除以USER_HZ得到以秒为单位的值。
process_resident_memory_bytes即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换出的内存页面,但包含共享内存。
process_open_fds通过计算/proc/PID/fd目录下的文件总数得来。显示了Go进程当前打开的常规文件、套接字、伪终端总数。
process_max_fds读取/proc/{PID}/limits 文件中,Max Open Files所在行的值获得,该值是软限制(Soft Limit),软限制是内核为相应资源强制执行的值,而硬限制(Hard Limit)充当软限制的上限。
process_cpu_seconds_total该指标计算使用到utime(Go进程执行在用户态模式下的滴答数)和stime(Go进程执行在内核态时候的滴答数,例如系统调用时),他们的单位jiffies,jiffy 描述了两次系统定时器中断之间的滴答时间。process_cpu_seconds_total等于utime和stime之和除以USER_HZ。即将程序滴答总数除以 Hz(每秒滴答数)得到就是操作系统运行该进程的总时间(以秒为单位)。
coredns_health_request_duration_seconds_sum-
coredns_health_request_duration_seconds_count-
go_memstats_mspan_sys_bytes显示从操作系统中分配的,用于mspan结构体的内存大小。
coredns_forward_max_concurrent_rejects_total-
coredns_forward_healthcheck_broken_total-
go_memstats_mcache_sys_bytes显示从操作系统分配的,用于mcache结构体的内存大小。
go_memstats_mspan_inuse_bytes显示mspan结构体使用的内存大小。
go_threads通过runtime.CreateThreadProfile()调用获取,读取的是全局allm变量。
go_info该指标提供了Go版本信息。该指标数据来自runtime.Version()

采集自Kube-State-Metrics任务类型(Job)的任务名称和基础指标

任务名称(Job Name)指标类型指标名称
_kube-state-metrics基础指标kube_pod_container_status_waiting_reason
kube_pod_status_phase
kube_pod_container_status_last_terminated_reason
kube_pod_container_status_terminated_reason
kube_pod_status_ready
kube_node_status_condition
kube_pod_container_status_running
kube_pod_container_status_restarts_total
kube_pod_container_info
kube_pod_container_status_waiting
kube_pod_container_status_terminated
kube_pod_labels
kube_pod_owner
kube_pod_info
kube_pod_container_resource_limits
kube_persistentvolume_status_phase
kube_pod_container_resource_requests_memory_bytes
kube_pod_container_resource_requests_cpu_cores
kube_pod_container_resource_limits_memory_bytes
kube_node_status_capacity
kube_service_info
kube_pod_container_resource_limits_cpu_cores
kube_deployment_status_replicas_updated
kube_deployment_status_replicas_unavailable
kube_deployment_spec_replicas
kube_deployment_created
kube_deployment_metadata_generation
kube_deployment_status_replicas
kube_deployment_labels
kube_deployment_status_observed_generation
kube_deployment_status_replicas_available
kube_deployment_spec_strategy_rollingupdate_max_unavailable
kube_daemonset_status_desired_number_scheduled
kube_daemonset_updated_number_scheduled
kube_daemonset_status_number_ready
kube_daemonset_status_number_misscheduled
kube_daemonset_status_number_available
kube_daemonset_status_current_number_scheduled
kube_daemonset_created
kube_node_status_allocatable_cpu_cores
kube_node_status_capacity_memory_bytes
kube_node_spec_unschedulable
kube_node_status_allocatable_memory_bytes
kube_node_labels
kube_node_info
kube_namespace_labels
kube_node_status_capacity_cpu_cores
kube_node_status_capacity_pods
kube_node_status_allocatable_pods
kube_node_spec_taint
kube_statefulset_status_replicas
kube_statefulset_replicas
kube_statefulset_created
up
scrape_samples_scraped
scrape_duration_seconds
scrape_samples_post_metric_relabeling
scrape_series_added

Kubelet任务类型(Job)的任务名称和基础指标

任务名称(Job Name)指标类型指标名称指标含义
_arms/kubelet/metric基础指标rest_client_request_duration_seconds_bucket-
apiserver_client_certificate_expiration_seconds_bucket-
kubelet_pod_worker_duration_seconds_bucket-
kubelet_pleg_relist_duration_seconds_bucket-
workqueue_queue_duration_seconds_bucket-
rest_client_requests_total-
go_gc_duration_seconds数据来自调用debug.ReadGCStats(),调用该函数时,会将传入参数GCStats结构体的PauseQuantile字段设置为5,这样函数将会返回最小、25%、50%、75% 和最大这5个GC暂停时间百分位数。然后prometheus Go客户端根据返回的GC暂停时间百分位数、以及NumGC和PauseTotal变量创建摘要类型指标。
process_cpu_seconds_total该指标计算使用到utime(Go进程执行在用户态模式下的滴答数)和stime(Go进程执行在内核态时候的滴答数,例如系统调用时),他们的单位jiffies,jiffy 描述了两次系统定时器中断之间的滴答时间。process_cpu_seconds_total等于utime和stime之和除以USER_HZ。即将程序滴答总数除以 Hz(每秒滴答数)得到就是操作系统运行该进程的总时间(以秒为单位)。
process_resident_memory_bytes即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换出的内存页面,但包含共享内存。
kubernetes_build_info-
kubelet_node_name-
kubelet_certificate_manager_client_ttl_seconds-
kubelet_certificate_manager_client_expiration_renew_errors-
scrape_duration_seconds-
go_goroutines通过runtime.NumGoroutine()调用获取,基于调度器结构sched和全局allglen变量计算得来。由于sched结构体的所有字段可能并发的更改,因此最后会检查计算的值是否小于1,如果小于1,那么返回1。
crape_samples_post_metric_relabeling-
scrape_samples_scraped-
scrape_series_added-
up-
apiserver_client_certificate_expiration_seconds_count-
workqueue_adds_total-
workqueue_depth-

Cadvisor任务类型(Job)的任务名称和基础指标

任务名称(Job Name)指标类型指标名称
_arms/kubelet/cadvisor基础指标container_memory_failures_total(默认废弃)
container_memory_rss
container_spec_memory_limit_bytes
container_memory_failcnt
container_memory_cache
container_memory_swap
container_memory_usage_bytes
container_memory_max_usage_bytes
container_cpu_load_average_10s
container_fs_reads_total(默认废弃)
container_fs_writes_total(默认废弃)
container_network_transmit_errors_total
container_network_receive_bytes_total
container_network_transmit_packets_total
container_network_receive_errors_total
container_network_receive_bytes_total
container_network_receive_errors_total
container_network_transmit_errors_total
container_memory_working_set_bytes
container_cpu_usage_seconds_total
container_fs_reads_bytes_total
container_fs_writes_bytes_total
container_spec_cpu_quota
container_cpu_cfs_periods_total
container_cpu_cfs_throttled_periods_total
container_cpu_cfs_throttled_seconds_total
container_fs_inodes_free
container_fs_io_time_seconds_total
container_fs_io_time_weighted_seconds_total
container_fs_limit_bytes
container_tasks_state(默认废弃)
container_fs_read_seconds_total(默认废弃)
container_fs_write_seconds_total(默认废弃)
container_fs_usage_bytes
container_fs_inodes_total
container_fs_io_current
scrape_duration_seconds
scrape_samples_scraped
machine_cpu_cores
machine_memory_bytes
scrape_samples_post_metric_relabeling
scrape_series_added
up
_arms-prom/kube-apiserver/cadvisor基础指标scrape_duration_seconds
up
scrape_samples_scraped
scrape_samples_post_metric_relabeling
scrape_series_added

ACK Scheduler任务类型(Job)的任务名称和基础指标

任务名称(Job Name)指标类型指标名称
ack-scheduler基础指标rest_client_request_duration_seconds_bucket
scheduler_pod_scheduling_attempts_bucket
rest_client_requests_total
scheduler_pending_pods
scheduler_scheduler_cache_size
up

etcd任务类型(Job)的任务名称和基础指标

任务名称(Job Name)指标类型指标名称
etcd基础指标etcd_disk_backend_commit_duration_seconds_bucket
up
etcd_server_has_leader
etcd_debugging_mvcc_keys_total
etcd_debugging_mvcc_db_total_size_in_bytes
etcd_server_leader_changes_seen_total

Node任务类型(Job)的任务名称和基础指标

任务名称(Job Name)指标类型指标名称指标说明
node-exporter基础指标node_filesystem_size_bytes-
node_filesystem_readonly-
node_filesystem_free_bytes-
node_filesystem_avail_bytes-
node_cpu_seconds_total-
node_network_receive_bytes_total-
node_network_receive_errs_total-
node_network_transmit_bytes_total-
node_network_receive_packets_total-
node_network_transmit_drop_total-
node_network_transmit_errs_total-
node_network_up-
node_network_transmit_packets_total-
node_network_receive_drop_total-
go_gc_duration_seconds数据来自调用debug.ReadGCStats(),调用该函数时,会将传入参数GCStats结构体的PauseQuantile字段设置为5,这样函数将会返回最小、25%、50%、75% 和最大这5个GC暂停时间百分位数。然后prometheus Go客户端根据返回的GC暂停时间百分位数、以及NumGC和PauseTotal变量创建摘要类型指标。
node_load5-
node_filefd_allocated-
node_exporter_build_info-
node_disk_written_bytes_total-
node_disk_writes_completed_total-
node_disk_write_time_seconds_total-
node_nf_conntrack_entries-
node_nf_conntrack_entries_limit-
node_processes_max_processes-
node_processes_pids-
node_sockstat_TCP_alloc-
node_sockstat_TCP_inuse-
node_sockstat_TCP_tw-
node_timex_offset_seconds-
node_timex_sync_status-
node_uname_info-
node_vmstat_pgfault-
node_vmstat_pgmajfault-
node_vmstat_pgpgin-
node_vmstat_pgpgout-
node_disk_reads_completed_total-
node_disk_read_time_seconds_total-
process_cpu_seconds_total该指标计算使用到utime(Go进程执行在用户态模式下的滴答数)和stime(Go进程执行在内核态时候的滴答数,例如系统调用时),他们的单位jiffies,jiffy 描述了两次系统定时器中断之间的滴答时间。process_cpu_seconds_total等于utime和stime之和除以USER_HZ。即将程序滴答总数除以 Hz(每秒滴答数)得到就是操作系统运行该进程的总时间(以秒为单位)。
node_disk_read_bytes_total-
node_disk_io_time_weighted_seconds_total-
node_disk_io_time_seconds_total-
node_disk_io_now-
node_context_switches_total-
node_boot_time_seconds-
process_resident_memory_bytes即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换出的内存页面,但包含共享内存。
node_intr_total-
node_load1-
go_goroutines通过runtime.NumGoroutine()调用获取,基于调度器结构sched和全局allglen变量计算得来。由于sched结构体的所有字段可能并发的更改,因此最后会检查计算的值是否小于1,如果小于1,那么返回1。
scrape_duration_seconds-
node_load15-
scrape_samples_post_metric_relabeling-
node_netstat_Tcp_PassiveOpens-
scrape_samples_scraped-
node_netstat_Tcp_CurrEstab-
scrape_series_added-
node_netstat_Tcp_ActiveOpens-
node_memory_MemTotal_bytes-
node_memory_MemFree_bytes-
node_memory_MemAvailable_bytes-
node_memory_Cached_bytes-
up-
node_memory_Buffers_bytes-

GPU任务类型(Job)的任务名称和基础指标

任务名称(Job Name)指标类型指标名称指标说明
gpu-exporter基础指标go_gc_duration_seconds数据来自调用debug.ReadGCStats(),调用该函数时,会将传入参数GCStats结构体的PauseQuantile字段设置为5,这样函数将会返回最小、25%、50%、75% 和最大这5个GC暂停时间百分位数。然后prometheus Go客户端根据返回的GC暂停时间百分位数、以及NumGC和PauseTotal变量创建摘要类型指标。
promhttp_metric_handler_requests_total-
scrape_series_added-
up-
scrape_duration_seconds-
scrape_samples_scraped-
scrape_samples_post_metric_relabeling-
go_memstats_mcache_inuse_bytes显示mcache结构体使用的内存大小。
process_virtual_memory_max_bytes-
process_virtual_memory_bytes即VSS(Virtual Set Size),指的虚拟内存集,是全部分配的内存,包括分配但未使用的内存、共享内存、换出的内存。
process_start_time_seconds使用到start_timestart_time描述了进程启动时的时间,单位是jiffies,数据来自/proc/stat。最后将start_time除以USER_HZ得到以秒为单位的值。
go_memstats_next_gc_bytes显示下个GC循环时候,堆占用内存大小。GC的目标是保证go_memstats_heap_alloc_bytes小于此值。
go_memstats_heap_objects显示有多少对象是堆上在分配的,会随着GC和新对象的分配而改变。
process_resident_memory_bytes即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换出的内存页面,但包含共享内存。
process_open_fds通过计算/proc/PID/fd目录下的文件总数得来。显示了Go进程当前打开的常规文件、套接字、伪终端总数。
process_max_fds读取/proc/{PID}/limits 文件中,Max Open Files所在行的值获得,该值是软限制(Soft Limit),软限制是内核为相应资源强制执行的值,而硬限制(Hard Limit)充当软限制的上限。
go_memstats_other_sys_bytes显示用于其他运行时分配占用内存大小。
go_gc_duration_seconds_count-
go_memstats_heap_alloc_bytes该指标展示了在堆上为对象分配了多少字节的内存。该指标包括所有可达(reachable)堆对象和不可达(unreachable)对象(GC尚未释放的)占用的内存大小。
process_cpu_seconds_total该指标计算使用到utime(Go进程执行在用户态模式下的滴答数)和stime(Go进程执行在内核态时候的滴答数,例如系统调用时),他们的单位jiffies,jiffy 描述了两次系统定时器中断之间的滴答时间。process_cpu_seconds_total等于utime和stime之和除以USER_HZ。即将程序滴答总数除以 Hz(每秒滴答数)得到就是操作系统运行该进程的总时间(以秒为单位)。
nvidia_gpu_temperature_celsius(默认废弃)-
go_memstats_stack_inuse_bytes显示栈内存Span上已使用的内存大小,该Span上面至少分配了一个栈对象。
nvidia_gpu_power_usage_milliwatts(默认废弃)-
nvidia_gpu_num_devices(默认废弃)-
nvidia_gpu_memory_used_bytes(默认废弃)-
nvidia_gpu_memory_total_bytes(默认废弃)-
go_memstats_stack_sys_bytes显示从操作系统中获得多少字节的栈内存。是go_memstats_stack_inuse_bytes 加上操作系统线程栈得到。
nvidia_gpu_memory_allocated_bytes(默认废弃)-
nvidia_gpu_duty_cycle(默认废弃)-
nvidia_gpu_allocated_num_devices(默认废弃)-
promhttp_metric_handler_requests_in_flight-
go_memstats_sys_bytes该指标用于衡量Go从系统中总共获取了多少字节的内存。
go_memstats_gc_sys_bytes显示垃圾收集元数据占用内存大小。
go_memstats_gc_cpu_fraction显示自程序启动以来,GC所占用CPU时间的比例。
go_memstats_heap_released_bytes显示有多少空闲Span已归还操作系统。
go_memstats_frees_total是一个计数器值,用于显示有多个堆对象被释放。可以使用rate()函数计算堆对象释放速率。同时可以通过go_memstats_mallocs_total -go_memstats_frees_total得到存活的堆对象数量。
go_threads通过runtime.CreateThreadProfile()调用获取,读取的是全局allm变量。
go_memstats_mspan_sys_bytes显示从操作系统中分配的,用于mspan结构体的内存大小。
go_memstats_buck_hash_sys_bytes显示用于Profiling的哈希表占用的内存大小。
go_memstats_alloc_bytes_total该指标随着对象在堆中分配而增加,但在释放对象时并不会减少。类似Prometheus的计数器类型,对该指标可以使用rate()来获取内存消耗速度。
go_memstats_heap_sys_bytes该指标显示从操作系统中为堆分配的内存字节数。它包括已保留但尚未使用的虚拟地址空间
go_memstats_mspan_inuse_bytes显示mspan结构体使用的内存大小。
go_memstats_alloc_bytes该指标展示了在 上为对象分配了多少字节的内存。该值与go_memstats_heap_alloc_bytes相同。该指标包括所有可达(reachable)堆对象和不可达(unreachable)对象(GC尚未释放的)占用的内存大小。
go_info该指标提供了Go版本信息。该指标数据来自runtime.Version()
go_memstats_last_gc_time_seconds上一次GC完成时的时间戳。
go_memstats_heap_inuse_bytes显示正在使用的Span占用字节数。
go_memstats_mcache_sys_bytes显示从操作系统分配的,用于mcache结构体的内存大小。
go_memstats_lookups_total是一个计数器值,用于计算有多少指针解引用。可以使用rate()函数来计算指针解引用速率。
go_memstats_mallocs_total是一个计数器值,用于显示有多少堆对象进行分配了。可以使用rate()函数来计算堆对象分配速率。
go_gc_duration_seconds_sum-
go_goroutines通过runtime.NumGoroutine()调用获取,基于调度器结构sched和全局allglen变量计算得来。由于sched结构体的所有字段可能并发的更改,因此最后会检查计算的值是否小于1,如果小于1,那么返回1。
go_memstats_heap_idle_bytes显示空闲Span占用的内存字节数。

PV任务类型(Job)的任务名称和基础指标

任务名称(Job Name)指标类型指标名称
k8s-csi-cluster-pv基础指标cluster_pvc_detail_num_total
cluster_pv_detail_num_total
cluster_pv_status_num_total
cluster_scrape_collector_success
cluster_scrape_collector_duration_seconds
alibaba_cloud_storage_operator_build_info
cluster_pvc_status_num_total
scrape_duration_seconds
scrape_samples_post_metric_relabeling
scrape_samples_scraped
scrape_series_added
up
k8s-csi-node-pv基础指标cluster_scrape_collector_duration_seconds
cluster_scrape_collector_success
alibaba_cloud_csi_driver_build_info
up
scrape_series_added
scrape_samples_post_metric_relabeling
scrape_samples_scraped
scrape_duration_seconds

企业云监控

Prometheus实例 for 企业云监控支持的指标如下表所示。

指标分类指标类型指标名称指标说明
ECS自定义指标cpu_util_lization(ECS)CPU使用率
internet_in_rate(ECS)公网流入流量平均速率
internet_out_rate(ECS)公网流出流量平均速率
disk_read_bps(ECS)所有磁盘读取BPS
disk_write_bps(ECS)所有磁盘每秒读取次数
vpc_public_ip_internet_in_Rate(ECS)IP维度公网流入平均速率
vpc_public_ip_internet_out_Rate(ECS)IP维度公网流出带宽使用率
cpu_total(Agent)cpu.total
memory_totalspace(Agent)memory.total.space
memory_usedutilization(Agent)memory.used.utilization
diskusage_utilization(Agent)disk.usage.utilization_device
RDS自定义指标cpu_usage_averageCPU使用率
disk_usage磁盘使用率
iops_usageIOPS使用率
connection_usage连接数使用率
data_delay只读实例延迟
memory_usage内存使用率
mysql_network_in_newMySQL网络流入带宽
mysql_network_out_newMySQL网络流出带宽
mysql_active_sessionsMySQL_ActiveSessions
sqlserver_network_in_newSQLServer网络流入带宽
sqlserver_network_out_newSQLServer网络流出带宽
NAT自定义指标snat_connectionSNAT连接数
snat_connection_drop_limit历史累积最大限制丢弃连接数
snat_connection_drop_rate_limit历史累积新建限制丢弃连接数
net_rx_rate流入带宽
net_tx_rate流出带宽
net_rx_pkgs流入包速率
net_tx_pkgs流出包速率
RocketMQ自定义指标consumer_lag_gid消息堆积
receive_message_count_gidConsumer(GroupId) 每分钟接收消息数量
send_message_count_gidProducer(GroupId) 每分钟发送消息的数量
consumer_lag_topic消息堆积(GroupID&Topic)
receive_message_count_topicConsumer(GroupId&Topic) 每分钟接收消息数量
send_message_count_topicProducer(GroupId&Topic) 每分钟发送消息数量
receive_message_count 每分钟接收消息数量
send_message_count 每分钟发送消息数量
SLB自定义指标healthy_server_count后端健康ECS实例个数
unhealthy_server_count后端异常ECS实例个数
packet_tx每秒流入数据包数
packet_rx每秒流出数据包数
traffic_rx_new流入带宽
traffic_tx_new流出带宽
active_connectionTCP活跃连接数
inactive_connection端口非活跃连接数
new_connectionTCP新建连接数
max_connection端口并发连接数
instance_active_connection实例活跃连接数
instance_new_connection实例每秒新建连接数
instance_max_connection实例每秒最大并发连接数
instance_drop_connection实例每秒丢失连接数
instance_traffic_rx实例每秒入bit数
instance_traffic_tx实例每秒出bit数
E-MapReduce(EMR)自定义指标active_applicationsactive状态的作业个数
active_usersactive的用户数
aggregate_containers_allocated总共分配的container个数
aggregate_containers_released总共释放的container个数
allocated_containers分配的container个数
apps_completed已完成的作业数
apps_failed失败的作业数
apps_killed被杀死的作业数
apps_pending等待的作业数
apps_running运行中的作业数
apps_submitted提交的作业数
available_mb当前队列当前可用的内存大小
available_vcores当前队列可用的VCore个数
pending_containers等待的container个数
reserved_containers预留的container个数
EIP自定义指标net_rx_rate流入带宽
net_tx_rate流出带宽
net_rx_pkgs_rate流入包速率
net_tx_pkgs_rate流出包速率
out_ratelimit_drop_speed限速丢包速率
OSS自定义指标availability可用性
request_valid_rate有效请求率
success_rate成功请求占比
network_error_rate网络错误请求占比
total_request_count总请求数
valid_count有效请求数
internet_send公网流出流量
internet_recv公网流入流量
intranet_send内网流出流量
intranet_recv内网流入流量
success_count成功请求总数
network_error_count网络错误请求总数
client_timeout_count客户端超时错误请求总数
Elasticsearch(ES)自定义指标node_cpu_utilizationElasticsearch实例节点CPU使用率
node_heap_memory_utilizationElasticsearch实例节点HeapMemory使用率
node_stats_exception_log_countException次数
node_stats_full_gc_collection_countFullGc次数
node_disk_utilizationElasticsearch实例节点磁盘使用率
node_load_1m节点Load_1m
cluster_query_qps集群查询QPS
cluster_index_qpsClusterIndexQPS
Logstash自定义指标cpu_percentLogstash实例节点CPU使用率
node_heap_memory节点内存使用量
node_disk_usageLogstash实例节点磁盘使用率
DRDS自定义指标cpu_utilizationCPU使用率
connection_count连接数
logic_qps逻辑QPS
logic_rt逻辑RT
memory_utilization内存利用率
network_input_traffic网络输入带宽
network_output_traffic网络输出带宽
physics_qps物理QPS
physics_rt物理RT
thread_count活跃线程数
com_insert_select私有RDS_MySQL每秒InsertSelect量
com_replace私有RDS_MySQL每秒Replace量
com_replace_select私有RDS_MySQL每秒ReplaceSelect量
com_select私有RDS_MySQL每秒Select量
com_update私有RDS_MySQL每秒Update量
conn_usage私有RDS_MySQL连接数利用率
cpu_usage私有RDS_MySQL CPU使用率
disk_usage私有RDS_MySQL磁盘使用率
ibuf_dirty_ratio私有RDS_MySQL_BP脏页百分率
ibuf_pool_reads私有RDS_MySQL每秒物理读次数
ibuf_read_hit私有RDS_MySQL_BP读命中率
ibuf_request_r私有RDS_MySQL每秒逻辑读次数
ibuf_request_w私有RDS_MySQL每秒逻辑写次数
ibuf_use_ratio私有RDS_MySQL_BP利用率
inno_data_read私有RDS_MySQL_InnoDB每秒读取数据量
inno_data_written私有RDS_MySQL_InnoDB每秒写入数据量
inno_row_delete私有RDS_MySQL_InnoDB每秒删除行数
inno_row_insert私有RDS_MySQL_InnoDB每秒插入行数
inno_row_readed私有RDS_MySQL_InnoDB每秒读取行数
inno_row_update私有RDS_MySQL_InnoDB每秒更新行数
innodb_log_write_requests私有RDS_MySQL_InnoDB每秒日志写请求次数
innodb_log_writes私有RDS_MySQL_InnoDB每秒日志物理写次数
innodb_os_log_fsyncs私有RDS_MySQL_InnoDB每秒日志fsync量
input_traffic_ps私有RDS_MySQL网络流入带宽
iops_usage私有RDS_MySQL IOPS利用率
mem_usage私有RDS_MySQL内存利用率
output_traffic_ps私有RDS_MySQL网络流出带宽
qps私有RDS_MySQL每秒查询量
slave_lag私有RDS_MySQL只读实例延迟
slow_queries私有RDS_MySQL每秒慢查询量
tb_tmp_disk私有RDS_MySQL每秒创建临时表数量
Kafka自定义指标instance_disk_capacity实例磁盘使用率
instance_message_input实例消息生产量
instance_message_output实例消息消费量
topic_message_inputTopic消息生产量
topic_message_outputTopic消息消费量
MongoDB自定义指标cpu_utilizationCPU使用率
memory_utilization内存使用百分比
disk_utilization磁盘使用率
iops_utilizationIOPS使用率
qps每秒请求数
connect_amount连接数使用量
instance_disk_amount实例占用磁盘空间量
data_disk_amount数据占用磁盘空间量
log_disk_amount日志占用磁盘空间量
intranet_in内网网络入流量
intranet_out内网网络出流量
number_requests请求数
op_insertInsert操作次数
op_queryQuery操作次数
op_updateUpdate操作次数
op_deleteDelete操作次数
op_getmoreGetmore操作次数
op_commandCommand操作次数
PolarDB自定义指标active_connections活跃连接数
blks_read_delta数据块读取数
cluster_active_sessions活跃连接数
cluster_connection_utilization连接数使用率
cluster_cpu_utilizationCPU使用率
cluster_data_io每秒存储引擎IO吞吐量
cluster_data_iops每秒存储引擎IO次数
cluster_mem_hit_ratio内存命中率
cluster_memory_utilization内存使用率
cluster_qps每秒查询数量
cluster_slow_queries_ps每秒慢查询数量
cluster_tps每秒事务数
conn_usage连接使用率
cpu_totalCPU使用率
db_age数据库最大年龄
instance_connection_utilization实例连接数使用率
instance_cpu_utilization实例CPU使用率
instance_input_bandwidth实例输入带宽
instance_memory_utilization实例内存使用率
instance_output_bandwidth实例输出带宽
mem_usage内存利用率
pls_data_sizepg数据盘大小
pls_iopspg IOPS
pls_iops_readpg读IOPS
pls_iops_writepg写IOPS
pls_pg_wal_dir_sizepg WAL日志大小
pls_throughputpg IO吞吐
pls_throughput_readpg读IO吞吐
pls_throughput_writepg写IO吞吐
swell_timepg膨胀点
tpspg TPS
cluster_iops每秒IO次数
Redis自定义指标intranet_in_ratio写入带宽使用率
intranet_out_ratio读取带宽使用率
failed_count操作失败数
cpu_usageCPU使用率
used_memory内存使用量
used_connection已用连接数
used_qps已用QPS数量

云服务自监控

Prometheus for 云服务自监控支持的指标如下表所示。

消息队列RocketMQ

指标分类指标类型指标名称指标说明
生产者自定义指标rocketmq_producer_requests发送相关API调用次数
rocketmq_producer_messages发送消息量
rocketmq_producer_message_size_bytes发送消息的总大小
rocketmq_producer_send_success_rate发送消息成功率
rocketmq_producer_failure_api_calls发送API调用失败次数
rocketmq_producer_send_rt_milliseconds_avg发送消息耗时平均值
rocketmq_producer_send_rt_milliseconds_min发送消息耗时最小值
rocketmq_producer_send_rt_milliseconds_max发送消息耗时最大值
rocketmq_producer_send_rt_milliseconds_p95发送消息耗时P95值
rocketmq_producer_send_rt_milliseconds_p99发送消息耗时P99值
消费者自定义指标rocketmq_consumer_requests消费消息相关API调用次数
rocketmq_consumer_send_back_requests消费者消费失败回发接口调用次数
rocketmq_consumer_send_back_messages消费者消费失败回发的消息
rocketmq_consumer_messages消费消息量
rocketmq_consumer_message_size_bytes消费消息量大小(一分钟累积量)
rocketmq_consumer_ready_and_inflight_messages消息消费滞后量(包括已就绪消息量和处理中消息量)
rocketmq_consumer_ready_messages已就绪消息量
rocketmq_consumer_inflight_messages处理中消息量
rocketmq_consumer_queue_time_milliseconds消息排队时间
rocketmq_consumer_message_await_time_milliseconds_avg消息在消费者客户端等待处理资源耗时平均值
rocketmq_consumer_message_await_time_milliseconds_min消息在消费者客户端等待处理资源耗时最小值
rocketmq_consumer_message_await_time_milliseconds_max消息在消费者客户端等待处理资源耗时最大值
rocketmq_consumer_message_await_time_milliseconds_p95消息在消费者客户端等待处理资源耗时P95值
rocketmq_consumer_message_await_time_milliseconds_p99消息在消费者客户端等待处理资源耗时P99值
rocketmq_consumer_message_process_time_milliseconds_avg消费者处理消息耗时平均值
rocketmq_consumer_message_process_time_milliseconds_min消费者处理消息耗时最小值
rocketmq_consumer_message_process_time_milliseconds_max消费者处理消息耗时最大值
rocketmq_consumer_message_process_time_milliseconds_p95消费者处理消息耗时P95值
rocketmq_consumer_message_process_time_milliseconds_p99消费者处理消息耗时P99值
rocketmq_consumer_consume_success_rate消费消息成功率
rocketmq_consumer_failure_api_calls消费API调用失败次数
rocketmq_consumer_to_dlq_messages进死信消息量
Overview自定义指标rabbitmq_instance_api_total实例级别API调用次数,秒级别
rabbitmq_connections_opened_total已打开的连接总数
rabbitmq_connections_closed_total已关闭的连接总数
rabbitmq_channels_opened_total打开的通道总数
rabbitmq_channels_closed_total关闭的通道总数
rabbitmq_queues_declared_total声明的队列总数
rabbitmq_queues_deleted_total删除的队列总数
rabbitmq_exchange_declared_total-
rabbitmq_exchange_deleted_total-
rabbitmq_exchange_bind_total-
rabbitmq_exchange_unbind_total-
rabbitmq_queue_bind_total-
rabbitmq_queue_unbind_total-
rabbitmq_connections当前打开的连接
rabbitmq_channels目前开放的渠道
Connections自定义指标rabbitmq_connection_channels连接上的通道
Exchange自定义指标rabbitmq_exchange_messages_published_in_total流入消息量
rabbitmq_exchange_messages_published_out_total流出消息量
Queues自定义指标rabbitmq_queue_messages_published_total发布到队列的消息总数
rabbitmq_queue_messages_ready准备好交付给消费者的消息量
rabbitmq_queue_messages_unacked定时中的消息量
rabbitmq_queue_deliver_total已传递给消费者但尚未确认的消息总数
rabbitmq_queue_get_total-
rabbitmq_queue_ack_total-
rabbitmq_queue_uack_total-
rabbitmq_queue_recover_total-
rabbitmq_queue_reject_total-
rabbitmq_queue_consumers队列中的消费者

MongoDB

指标类型指标名称指标说明
自定义指标avg_rt实例平均响应时间
bytes_in实例的网络进口流量
bytes_out实例的网络出口流量
bytes_read_into_cacheWiredTiger,显示读入Cache的数据量大小
bytes_written_from_cacheWiredTiger,显示从Cache写的磁盘大小
command协议命令操作QPS数
conn_usage连接数使用率,显示实例当前连接数与最大连接数的比值
connections_active实例当前活跃连接数
cpu_usage实例的CPU使用率
current_conn实例当前连接总数
data_iops数据盘的IOPS使用量
data_size实例数据磁盘使用空间
delete删除操作QPS数
disk_usage磁盘使用率,显示实例总使用空间与最大可使用空间的比值
document_deleted_ps实例删除的文档数量
document_inserted_ps实例插入的文档数量
document_returned_ps实例返回的文档数量
document_updated_ps实例更新的文档数量。
getmore读取操作QPS数
gl_ac_readers实例当前使用全局读锁数量
gl_ac_writers实例当前使用全局写锁数量
gl_cq_readers全局读锁的等待队列长度
gl_cq_total所有全局锁的等待队列长度
gl_cq_writers全局写锁的等待队列长度
ins_size实例磁盘总使用空间
insert插入操作QPS数
iocheck_costIO延迟,当前IO的响应性能
iops_usageIOPS使用率
job_cursors_closedCursors,显示因关闭会话关闭的Cursor数量
log_iops日志盘的IOPS使用量
log_size实例日志磁盘使用空间
maximum_bytes_configuredWiredTiger,显示配置最大可用的磁盘大小
mem_usage内存使用率
moveChunk_donor_started_psmoveChunk,当前节点作为moveChunk源的次数
moveChunk_recip_stared_psmoveChunk,当前节点作为moveChunk目标的次数
noTimeout_openCursors,显示当前无超时时间的Cursor打开数量
operation_exactIDCount_ps操作详情,显示需要通过广播方式获取匹配_id的信息请求数
operation_scanAndOrder_ps操作详情,显示无法使用索引进行Sort的请求数
operation_writeConflicts_ps操作详情,显示发生写冲突的次数
pinned_openCursors,显示当前有超时时间的Cursor打开数量
query查询操作QPS数
queryExecutor_scannedObject_ps查询扫描索引与文档数量,显示查询扫描文档的数量
queryExecutor_scanned_ps查询扫描索引与文档数量,显示查询扫描索引的数量
read_concurrent_trans_availableWiredTiger请求队列,显示可用的读并发请求数
read_concurrent_trans_outWiredTiger请求队列,显示读并发请求数
repl_lag主备延迟,显示实例主备节点的数据同步延时信息
timed_outCursors,显示因超时关闭的Cursor数量
total_openCursors,显示当前Cursor打开数量
ttl_deletedDocuments_psTTL,显示因TTL索引而删除的文档数量
ttl_passes_psTTL,显示后台TTL线程进行删除的次数
update更新操作QPS数
write_concurrent_trans_availableWiredTiger请求队列,显示可用的写并发数
write_concurrent_trans_outWiredTiger请求队列,显示写并发请求数
wt_cache_dirty_usageWiredTigerCache使用率,显示实例WiredTiger引擎脏Cache使用率
wt_cache_usageWiredTigerCache使用率,显示实例WiredTiger引擎脏Cache使用率