阿里云Prometheus监控按照指标上报次数收费。指标分为两种类型:基础指标和自定义指标。其中,基础指标不收费,自定义指标于2020年01月06日开始收费。

Prometheus监控支持的容器集群基础指标如下表所示。

  • Prometheus状态信息的任务名称和基础指标如下:
    任务名称(Job Name) 指标名称 指标说明
    _arms-prom/kubelet/1 promhttp_metric_handler_requests_in_flight -
    go_memstats_mallocs_total 是一个计数器值,用于显示有多少堆对象进行分配了。可以使用rate()函数来计算堆对象分配速率。
    go_memstats_lookups_total 是一个计数器值,用于计算有多少指针解引用。可以使用rate()函数来计算指针解引用速率。
    go_memstats_last_gc_time_seconds 上一次GC完成时的时间戳。
    go_memstats_heap_sys_bytes 该指标显示从操作系统中为堆分配的内存字节数。它包括已保留但尚未使用的虚拟地址空间
    go_memstats_heap_released_bytes 显示有多少空闲Span已归还操作系统。
    go_memstats_heap_objects 显示有多少对象是堆上在分配的,会随着GC和新对象的分配而改变。
    go_memstats_heap_inuse_bytes 显示正在使用的Span占用字节数。
    go_memstats_heap_idle_bytes 显示空闲Span占用的内存字节数。
    go_memstats_heap_alloc_bytes 该指标展示了在堆上为对象分配了多少字节的内存。该指标包括所有可达(reachable)堆对象和不可达(unreachable)对象(GC尚未释放的)占用的内存大小。
    go_memstats_gc_sys_bytes 显示垃圾收集元数据占用内存大小。
    go_memstats_gc_cpu_fraction 显示自程序启动以来,GC所占用CPU时间的比例。
    go_memstats_frees_total 是一个计数器值,用于显示有多个堆对象被释放。可以使用rate()函数计算堆对象释放速率。同时可以通过go_memstats_mallocs_total – go_memstats_frees_total得到存活的堆对象数量。
    go_memstats_buck_hash_sys_bytes 显示用于Profiling的哈希表占用的内存大小。
    go_memstats_alloc_bytes_total 该指标随着对象在堆中分配而增加,但在释放对象时并不会减少。类似Prometheus的计数器类型,对该指标可以使用rate()来获取内存消耗速度。
    go_memstats_alloc_bytes 该指标展示了在上为对象分配了多少字节的内存。该指标包括所有可达(reachable)堆对象和不可达(unreachable)对象(GC尚未释放的)占用的内存大小。
    scrape_duration_seconds -
    go_info 该指标提供了Go版本信息。该指标数据来自runtime.Version()
    go_goroutines 通过runtime.NumGoroutine()调用获取,基于调度器结构sched和全局allglen变量计算得来。由于sched结构体的所有字段可能并发的更改,因此最后会检查计算的值是否小于1,如果小于1,那么返回1。
    scrape_samples_post_metric_relabeling -
    go_gc_duration_seconds_sum -
    go_gc_duration_seconds_count -
    blackbox_exporter_config_last_reload_successful -
    blackbox_exporter_config_last_reload_success_timestamp_seconds -
    scrape_samples_scraped -
    blackbox_exporter_build_info -
    arms_prometheus_target_scrapes_sample_out_of_order_total -
    arms_prometheus_target_scrapes_sample_out_of_bounds_total -
    arms_prometheus_target_scrapes_sample_duplicate_timestamp_total -
    scrape_series_added -
    arms_prometheus_target_scrapes_exceeded_sample_limit_total -
    arms_prometheus_target_scrapes_cache_flush_forced_total_arms-prom/kubelet/1 -
    arms_prometheus_target_scrape_pools_total -
    statsd_metric_mapper_cache_gets_total -
    statsd_metric_mapper_cache_hits_total -
    statsd_metric_mapper_cache_length -
    arms_prometheus_target_scrape_pools_failed_total -
    up -
    arms_prometheus_target_scrape_pool_reloads_total -
    arms_prometheus_target_scrape_pool_reloads_failed_total -
  • API Server任务类型(Job)的任务名称和基础指标如下:
    任务名称(Job Name) 指标名称
    apiserver apiserver_request_duration_seconds_bucket(默认废弃)
    apiserver_admission_controller_admission_duration_seconds_bucket
    apiserver_request_total
    rest_client_requests_total
    apiserver_admission_webhook_admission_duration_seconds_bucket
    apiserver_current_inflight_requests
    up
    apiserver_admission_webhook_admission_duration_seconds_count
    scrape_samples_post_metric_relabeling
    scrape_samples_scraped
    scrape_series_added
    scrape_duration_seconds
  • Ingress任务类型(Job)的任务名称和基础指标如下:
    任务名称(Job Name) 指标名称 指标描述
    arms-ack-ingress nginx_ingress_controller_request_duration_seconds_bucket -
    nginx_ingress_controller_response_duration_seconds_bucket(默认废弃) -
    nginx_ingress_controller_response_size_bucket(默认废弃) -
    nginx_ingress_controller_request_size_bucket -
    nginx_ingress_controller_bytes_sent_bucket -
    go_gc_duration_seconds 数据来自调用debug.ReadGCStats(),调用该函数时,会将传入参数GCStats结构体的PauseQuantile字段设置为5,这样函数将会返回最小、25%、50%、75% 和最大这5个GC暂停时间百分位数。然后prometheus Go客户端根据返回的GC暂停时间百分位数、以及NumGC和PauseTotal变量创建摘要类型指标。
    nginx_ingress_controller_nginx_process_connections -
    nginx_ingress_controller_request_duration_seconds_sum -
    nginx_ingress_controller_request_duration_seconds_count(默认废弃) -
    nginx_ingress_controller_bytes_sent_sum -
    nginx_ingress_controller_request_size_sum -
    nginx_ingress_controller_response_duration_seconds_count -
    nginx_ingress_controller_response_duration_seconds_sum(默认废弃) -
    nginx_ingress_controller_response_size_count(默认废弃) -
    nginx_ingress_controller_bytes_sent_count -
    nginx_ingress_controller_response_size_sum -
    nginx_ingress_controller_request_size_count -
    promhttp_metric_handler_requests_total -
    nginx_ingress_controller_nginx_process_connections_total -
    go_memstats_mcache_sys_bytes 显示从操作系统分配的,用于mcache结构体的内存大小。
    go_memstats_lookups_total 是一个计数器值,用于计算有多少指针解引用。可以使用rate()函数来计算指针解引用速率。
    go_threads 通过runtime.CreateThreadProfile()调用获取,读取的是全局allm变量。
    go_memstats_sys_bytes 该指标用于衡量Go从系统中总共获取了多少字节的内存。
    go_memstats_last_gc_time_seconds 上一次GC完成时的时间戳。
    go_memstats_heap_sys_bytes 该指标显示从操作系统中为堆分配的内存字节数。它包括已保留但尚未使用的虚拟地址空间
    go_memstats_heap_objects 显示有多少对象是堆上在分配的,会随着GC和新对象的分配而改变。
    go_memstats_heap_inuse_bytes 显示正在使用的Span占用字节数。
    go_memstats_heap_idle_bytes 显示空闲Span占用的内存字节数。
    go_memstats_heap_alloc_bytes 该指标展示了在堆上为对象分配了多少字节的内存。该指标包括所有可达(reachable)堆对象和不可达(unreachable)对象(GC尚未释放的)占用的内存大小。
    go_memstats_gc_sys_bytes 显示垃圾收集元数据占用内存大小。
    promhttp_metric_handler_requests_in_flight -
    go_memstats_stack_sys_bytes 显示从操作系统中获得多少字节的栈内存。是go_memstats_stack_inuse_bytes 加上操作系统线程栈得到。
    go_memstats_stack_inuse_bytes 显示栈内存Span上已使用的内存大小,该Span上面至少分配了一个栈对象。
    go_memstats_gc_cpu_fraction 显示自程序启动以来,GC所占用CPU时间的比例。
    go_memstats_frees_total 是一个计数器值,用于显示有多个堆对象被释放。可以使用rate()函数计算堆对象释放速率。同时可以通过go_memstats_mallocs_total – go_memstats_frees_total得到存活的堆对象数量。
    go_memstats_buck_hash_sys_bytes 显示用于Profiling的哈希表占用的内存大小。
    go_memstats_alloc_bytes_total 该指标随着对象在堆中分配而增加,但在释放对象时并不会减少。类似Prometheus的计数器类型,对该指标可以使用rate()来获取内存消耗速度。
    go_memstats_alloc_bytes 该指标展示了在堆上为对象分配了多少字节的内存。该指标包括所有可达(reachable)堆对象和不可达(unreachable)对象(GC尚未释放的)占用的内存大小。
    nginx_ingress_controller_nginx_process_num_procs -
    go_info 该指标提供了Go版本信息。该指标数据来自runtime.Version()
    go_memstats_mallocs_total 是一个计数器值,用于显示有多少堆对象进行分配了。可以使用rate()函数来计算堆对象分配速率。
    go_memstats_other_sys_bytes 显示用于其他运行时分配占用内存大小。
    go_goroutines 通过runtime.NumGoroutine()调用获取,基于调度器结构sched和全局allglen变量计算得来。由于sched结构体的所有字段可能并发的更改,因此最后会检查计算的值是否小于1,如果小于1,那么返回1。
    scrape_samples_post_metric_relabeling -
    scrape_samples_scraped -
    process_virtual_memory_max_bytes -
    process_virtual_memory_bytes 即VSS(Virtual Set Size),指虚拟内存集,是全部分配的内存,包括分配但未使用的内存、共享内存、换出的内存。
    scrape_duration_seconds -
    go_memstats_heap_released_bytes 显示有多少空闲Span已归还操作系统。
    go_gc_duration_seconds_sum -
    go_memstats_next_gc_bytes 显示下个GC循环时候,堆占用内存大小。GC的目标是保证go_memstats_heap_alloc_bytes小于此值。
    go_gc_duration_seconds_count -
    nginx_ingress_controller_config_hash -
    nginx_ingress_controller_config_last_reload_successful -
    nginx_ingress_controller_config_last_reload_successful_timestamp_seconds -
    nginx_ingress_controller_ingress_upstream_latency_seconds_count -
    nginx_ingress_controller_ingress_upstream_latency_seconds_sum -
    process_start_time_seconds 使用到start_timestart_time描述了进程启动时的时间,单位是jiffies,数据来自/proc/stat。最后将start_time除以USER_HZ得到以秒为单位的值。
    nginx_ingress_controller_nginx_process_cpu_seconds_total -
    scrape_series_added -
    nginx_ingress_controller_nginx_process_oldest_start_time_seconds -
    nginx_ingress_controller_nginx_process_read_bytes_total -
    nginx_ingress_controller_nginx_process_requests_total -
    nginx_ingress_controller_nginx_process_resident_memory_bytes -
    nginx_ingress_controller_nginx_process_virtual_memory_bytes -
    nginx_ingress_controller_nginx_process_write_bytes_total -
    nginx_ingress_controller_requests -
    go_memstats_mcache_inuse_bytes 显示mcache结构体使用的内存大小。
    nginx_ingress_controller_success -
    process_resident_memory_bytes 即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换出的内存页面,但包含共享内存。
    process_open_fds 通过计算/proc/PID/fd目录下的文件总数得来。显示了Go进程当前打开的常规文件、套接字、伪终端总数。
    process_max_fds 读取/proc/{PID}/limits 文件中,Max Open Files所在行的值获得,该值是软限制(Soft Limit),软限制是内核为相应资源强制执行的值,而硬限制(Hard Limit)充当软限制的上限。
    process_cpu_seconds_total 该指标计算使用到utime(Go进程执行在用户态模式下的滴答数)和stime(Go进程执行在内核态时候的滴答数,例如系统调用时),他们的单位jiffies,jiffy 描述了两次系统定时器中断之间的滴答时间。process_cpu_seconds_total等于utime和stime之和除以USER_HZ。即将程序滴答总数除以 Hz(每秒滴答数)得到就是操作系统运行该进程的总时间(以秒为单位)。
    go_memstats_mspan_sys_bytes 显示从操作系统中分配的,用于mspan结构体的内存大小。
    up -
    go_memstats_mspan_inuse_bytes 显示mspan结构体使用的内存大小。
    nginx_ingress_controller_ssl_expire_time_seconds -
    nginx_ingress_controller_leader_election_status -
  • CoreDNS任务类型(Job)的任务名称和基础指标如下:
    任务名称(Job Name) 指标名称 指标描述
    arms-ack-coredns coredns_forward_request_duration_seconds_bucket -
    coredns_dns_request_size_bytes_bucket -
    coredns_dns_response_size_bytes_bucket -
    coredns_kubernetes_dns_programming_duration_seconds_bucket -
    coredns_dns_request_duration_seconds_bucket -
    coredns_plugin_enabled -
    coredns_health_request_duration_seconds_bucket -
    go_gc_duration_seconds 数据来自调用debug.ReadGCStats(),调用该函数时,会将传入参数GCStats结构体的PauseQuantile字段设置为5,这样函数将会返回最小、25%、50%、75% 和最大这5个GC暂停时间百分位数。然后prometheus Go客户端根据返回的GC暂停时间百分位数、以及NumGC和PauseTotal变量创建摘要类型指标。
    coredns_forward_responses_total -
    coredns_forward_request_duration_seconds_sum -
    coredns_forward_request_duration_seconds_count -
    coredns_dns_requests_total -
    coredns_forward_conn_cache_misses_total -
    coredns_dns_responses_total -
    coredns_cache_entries -
    coredns_cache_hits_total -
    coredns_forward_conn_cache_hits_total -
    coredns_forward_requests_total -
    coredns_dns_request_size_bytes_sum -
    coredns_dns_response_size_bytes_count -
    coredns_dns_response_size_bytes_sum -
    coredns_dns_request_size_bytes_count -
    scrape_duration_seconds -
    scrape_samples_scraped -
    scrape_series_added -
    up -
    scrape_samples_post_metric_relabeling -
    go_memstats_lookups_total 是一个计数器值,用于计算有多少指针解引用。可以使用rate()函数来计算指针解引用速率。
    go_memstats_last_gc_time_seconds 上一次GC完成时的时间戳。
    go_memstats_heap_sys_bytes 该指标显示从操作系统中为堆分配的内存字节数。它包括已保留但尚未使用的虚拟地址空间
    coredns_build_info -
    go_memstats_heap_released_bytes 显示有多少空闲Span已归还操作系统。
    go_memstats_heap_objects 显示有多少对象是堆上在分配的,会随着GC和新对象的分配而改变。
    go_memstats_heap_inuse_bytes 显示正在使用的Span占用字节数。
    go_memstats_heap_idle_bytes 显示空闲Span占用的内存字节数。
    go_memstats_heap_alloc_bytes 该指标展示了在堆上为对象分配了多少字节的内存。该指标包括所有可达(reachable)堆对象和不可达(unreachable)对象(GC尚未释放的)占用的内存大小。
    go_memstats_gc_sys_bytes 显示垃圾收集元数据占用内存大小。
    go_memstats_sys_bytes 该指标用于衡量Go从系统中总共获取了多少字节的内存。
    go_memstats_stack_sys_bytes 显示从操作系统中获得多少字节的栈内存。是go_memstats_stack_inuse_bytes 加上操作系统线程栈得到。
    go_memstats_mallocs_total 是一个计数器值,用于显示有多少堆对象进行分配了。可以使用rate()函数来计算堆对象分配速率。
    go_memstats_gc_cpu_fraction 显示自程序启动以来,GC所占用CPU时间的比例。
    go_memstats_stack_inuse_bytes 显示栈内存Span上已使用的内存大小,该Span上面至少分配了一个栈对象。
    go_memstats_frees_total 是一个计数器值,用于显示有多个堆对象被释放。可以使用rate()函数计算堆对象释放速率。同时可以通过go_memstats_mallocs_total – go_memstats_frees_total得到存活的堆对象数量。
    go_memstats_buck_hash_sys_bytes 显示用于Profiling的哈希表占用的内存大小。
    go_memstats_alloc_bytes_total 该指标随着对象在堆中分配而增加,但在释放对象时并不会减少。类似Prometheus的计数器类型,对该指标可以使用rate()来获取内存消耗速度。
    go_memstats_alloc_bytes 该指标展示了在 上为对象分配了多少字节的内存。该值与go_memstats_heap_alloc_bytes相同。该指标包括所有可达(reachable)堆对象和不可达(unreachable)对象(GC尚未释放的)占用的内存大小。
    coredns_cache_misses_total -
    go_memstats_other_sys_bytes 显示用于其他运行时分配占用内存大小。
    go_memstats_mcache_inuse_bytes 显示mcache结构体使用的内存大小。
    go_goroutines 通过runtime.NumGoroutine()调用获取,基于调度器结构sched和全局allglen变量计算得来。由于sched结构体的所有字段可能并发的更改,因此最后会检查计算的值是否小于1,如果小于1,那么返回1。
    process_virtual_memory_max_bytes -
    process_virtual_memory_bytes 即VSS(Virtual Set Size),指虚拟内存集,是全部分配的内存,包括分配但未使用的内存、共享内存、换出的内存。
    go_gc_duration_seconds_sum -
    go_gc_duration_seconds_countarms-ack-coredns -
    go_memstats_next_gc_bytes 显示下个GC循环时候,堆占用内存大小。GC的目标是保证go_memstats_heap_alloc_bytes小于此值。
    coredns_dns_request_duration_seconds_count -
    coredns_reload_failed_total -
    coredns_panics_total -
    coredns_local_localhost_requests_total -
    coredns_kubernetes_dns_programming_duration_seconds_sum -
    coredns_kubernetes_dns_programming_duration_seconds_count -
    coredns_dns_request_duration_seconds_sum -
    coredns_hosts_reload_timestamp_seconds -
    oredns_health_request_failures_total -
    process_start_time_seconds 使用到start_timestart_time描述了进程启动时的时间,单位是jiffies,数据来自/proc/stat。最后将start_time除以USER_HZ得到以秒为单位的值。
    process_resident_memory_bytes 即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换出的内存页面,但包含共享内存。
    process_open_fds 通过计算/proc/PID/fd目录下的文件总数得来。显示了Go进程当前打开的常规文件、套接字、伪终端总数。
    process_max_fds 读取/proc/{PID}/limits 文件中,Max Open Files所在行的值获得,该值是软限制(Soft Limit),软限制是内核为相应资源强制执行的值,而硬限制(Hard Limit)充当软限制的上限。
    process_cpu_seconds_total 该指标计算使用到utime(Go进程执行在用户态模式下的滴答数)和stime(Go进程执行在内核态时候的滴答数,例如系统调用时),他们的单位jiffies,jiffy 描述了两次系统定时器中断之间的滴答时间。process_cpu_seconds_total等于utime和stime之和除以USER_HZ。即将程序滴答总数除以 Hz(每秒滴答数)得到就是操作系统运行该进程的总时间(以秒为单位)。
    coredns_health_request_duration_seconds_sum -
    coredns_health_request_duration_seconds_count -
    go_memstats_mspan_sys_bytes 显示从操作系统中分配的,用于mspan结构体的内存大小。
    coredns_forward_max_concurrent_rejects_total -
    coredns_forward_healthcheck_broken_total -
    go_memstats_mcache_sys_bytes 显示从操作系统分配的,用于mcache结构体的内存大小。
    go_memstats_mspan_inuse_bytes 显示mspan结构体使用的内存大小。
    go_threads 通过runtime.CreateThreadProfile()调用获取,读取的是全局allm变量。
    go_info 该指标提供了Go版本信息。该指标数据来自runtime.Version()
  • 采集自Kube-State-Metrics任务类型(Job)的任务名称和基础指标如下:
    任务名称(Job Name) 指标名称
    _kube-state-metrics kube_pod_container_status_waiting_reason
    kube_pod_status_phase
    kube_pod_container_status_last_terminated_reason
    kube_pod_container_status_terminated_reason
    kube_pod_status_ready
    kube_node_status_condition
    kube_pod_container_status_running
    kube_pod_container_status_restarts_total
    kube_pod_container_info
    kube_pod_container_status_waiting
    kube_pod_container_status_terminated
    kube_pod_labels
    kube_pod_owner
    kube_pod_info
    kube_pod_container_resource_limits
    kube_persistentvolume_status_phase
    kube_pod_container_resource_requests_memory_bytes
    kube_pod_container_resource_requests_cpu_cores
    kube_pod_container_resource_limits_memory_bytes
    kube_node_status_capacity
    kube_service_info
    kube_pod_container_resource_limits_cpu_cores
    kube_deployment_status_replicas_updated
    kube_deployment_status_replicas_unavailable
    kube_deployment_spec_replicas
    kube_deployment_created
    kube_deployment_metadata_generation
    kube_deployment_status_replicas
    kube_deployment_labels
    kube_deployment_status_observed_generation
    kube_deployment_status_replicas_available
    kube_deployment_spec_strategy_rollingupdate_max_unavailable
    kube_daemonset_status_desired_number_scheduled
    kube_daemonset_updated_number_scheduled
    kube_daemonset_status_number_ready
    kube_daemonset_status_number_misscheduled
    kube_daemonset_status_number_available
    kube_daemonset_status_current_number_scheduled
    kube_daemonset_created
    kube_node_status_allocatable_cpu_cores
    kube_node_status_capacity_memory_bytes
    kube_node_spec_unschedulable
    kube_node_status_allocatable_memory_bytes
    kube_node_labels
    kube_node_info
    kube_namespace_labels
    kube_node_status_capacity_cpu_cores
    kube_node_status_capacity_pods
    kube_node_status_allocatable_pods
    kube_node_spec_taint
    kube_statefulset_status_replicas
    kube_statefulset_replicas
    kube_statefulset_created
    up
    scrape_samples_scraped
    scrape_duration_seconds
    scrape_samples_post_metric_relabeling
    scrape_series_added
  • Kubelet任务类型(Job)的任务名称和基础指标如下:
    任务名称(Job Name) 指标名称 指标含义
    _arms/kubelet/metric rest_client_request_duration_seconds_bucket -
    apiserver_client_certificate_expiration_seconds_bucket -
    kubelet_pod_worker_duration_seconds_bucket -
    kubelet_pleg_relist_duration_seconds_bucket -
    workqueue_queue_duration_seconds_bucket -
    rest_client_requests_total -
    go_gc_duration_seconds 数据来自调用debug.ReadGCStats(),调用该函数时,会将传入参数GCStats结构体的PauseQuantile字段设置为5,这样函数将会返回最小、25%、50%、75% 和最大这5个GC暂停时间百分位数。然后prometheus Go客户端根据返回的GC暂停时间百分位数、以及NumGC和PauseTotal变量创建摘要类型指标。
    process_cpu_seconds_total 该指标计算使用到utime(Go进程执行在用户态模式下的滴答数)和stime(Go进程执行在内核态时候的滴答数,例如系统调用时),他们的单位jiffies,jiffy 描述了两次系统定时器中断之间的滴答时间。process_cpu_seconds_total等于utime和stime之和除以USER_HZ。即将程序滴答总数除以 Hz(每秒滴答数)得到就是操作系统运行该进程的总时间(以秒为单位)。
    process_resident_memory_bytes 即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换出的内存页面,但包含共享内存。
    kubernetes_build_info -
    kubelet_node_name -
    kubelet_certificate_manager_client_ttl_seconds -
    kubelet_certificate_manager_client_expiration_renew_errors -
    scrape_duration_seconds -
    go_goroutines 通过runtime.NumGoroutine()调用获取,基于调度器结构sched和全局allglen变量计算得来。由于sched结构体的所有字段可能并发的更改,因此最后会检查计算的值是否小于1,如果小于1,那么返回1。
    crape_samples_post_metric_relabeling -
    scrape_samples_scraped -
    scrape_series_added -
    up -
    apiserver_client_certificate_expiration_seconds_count -
    workqueue_adds_total -
    workqueue_depth -
  • Cadvisor任务类型(Job)的任务名称和基础指标如下:
    任务名称(Job Name) 指标名称
    _arms/kubelet/cadvisor container_memory_failures_total(默认废弃)
    container_memory_rss
    container_spec_memory_limit_bytes
    container_memory_failcnt
    container_memory_cache
    container_memory_swap
    container_memory_usage_bytes
    container_memory_max_usage_bytes
    container_cpu_load_average_10s
    container_fs_reads_total(默认废弃)
    container_fs_writes_total(默认废弃)
    container_network_transmit_errors_total
    container_network_receive_bytes_total
    container_network_transmit_packets_total
    container_network_receive_errors_total
    container_network_receive_bytes_total
    container_network_receive_errors_total
    container_network_transmit_errors_total
    container_memory_working_set_bytes
    container_cpu_usage_seconds_total
    container_fs_reads_bytes_total
    container_fs_writes_bytes_total
    container_spec_cpu_quota
    container_cpu_cfs_periods_total
    container_cpu_cfs_throttled_periods_total
    container_cpu_cfs_throttled_seconds_total
    container_fs_inodes_free
    container_fs_io_time_seconds_total
    container_fs_io_time_weighted_seconds_total
    container_fs_limit_bytes
    container_tasks_state(默认废弃)
    container_fs_read_seconds_total(默认废弃)
    container_fs_write_seconds_total(默认废弃)
    container_fs_usage_bytes
    container_fs_inodes_total
    container_fs_io_current
    scrape_duration_seconds
    scrape_samples_scraped
    machine_cpu_cores
    machine_memory_bytes
    scrape_samples_post_metric_relabeling
    scrape_series_added
    up
    _arms-prom/kube-apiserver/cadvisor scrape_duration_seconds
    up
    scrape_samples_scraped
    scrape_samples_post_metric_relabeling
    scrape_series_added
  • ACK Scheduler任务类型(Job)的任务名称和基础指标如下:
    任务名称(Job Name) 指标名称
    ack-scheduler rest_client_request_duration_seconds_bucket
    scheduler_pod_scheduling_attempts_bucket
    rest_client_requests_total
    scheduler_pending_pods
    scheduler_scheduler_cache_size
    up
  • etcd任务类型(Job)的任务名称和基础指标如下:
    任务名称(Job Name) 指标名称
    etcd etcd_disk_backend_commit_duration_seconds_bucket
    up
    etcd_server_has_leader
    etcd_debugging_mvcc_keys_total
    etcd_debugging_mvcc_db_total_size_in_bytes
    etcd_server_leader_changes_seen_total
  • Node任务类型(Job)的任务名称和基础指标如下:
    任务名称(Job Name) 指标名称 指标描述
    node-exporter node_filesystem_size_bytes -
    node_filesystem_readonly -
    node_filesystem_free_bytes -
    node_filesystem_avail_bytes -
    node_cpu_seconds_total -
    node_network_receive_bytes_total -
    node_network_receive_errs_total -
    node_network_transmit_bytes_total -
    node_network_receive_packets_total -
    node_network_transmit_drop_total -
    node_network_transmit_errs_total -
    node_network_up -
    node_network_transmit_packets_total -
    node_network_receive_drop_total -
    go_gc_duration_seconds 数据来自调用debug.ReadGCStats(),调用该函数时,会将传入参数GCStats结构体的PauseQuantile字段设置为5,这样函数将会返回最小、25%、50%、75% 和最大这5个GC暂停时间百分位数。然后prometheus Go客户端根据返回的GC暂停时间百分位数、以及NumGC和PauseTotal变量创建摘要类型指标。
    node_load5 -
    node_filefd_allocated -
    node_exporter_build_info -
    node_disk_written_bytes_total -
    node_disk_writes_completed_total -
    node_disk_write_time_seconds_total -
    node_nf_conntrack_entries -
    node_nf_conntrack_entries_limit -
    node_processes_max_processes -
    node_processes_pids -
    node_sockstat_TCP_alloc -
    node_sockstat_TCP_inuse -
    node_sockstat_TCP_tw -
    node_timex_offset_seconds -
    node_timex_sync_status -
    node_uname_info -
    node_vmstat_pgfault -
    node_vmstat_pgmajfault -
    node_vmstat_pgpgin -
    node_vmstat_pgpgout -
    node_disk_reads_completed_total -
    node_disk_read_time_seconds_total -
    process_cpu_seconds_total 该指标计算使用到utime(Go进程执行在用户态模式下的滴答数)和stime(Go进程执行在内核态时候的滴答数,例如系统调用时),他们的单位jiffies,jiffy 描述了两次系统定时器中断之间的滴答时间。process_cpu_seconds_total等于utime和stime之和除以USER_HZ。即将程序滴答总数除以 Hz(每秒滴答数)得到就是操作系统运行该进程的总时间(以秒为单位)。
    node_disk_read_bytes_total -
    node_disk_io_time_weighted_seconds_total -
    node_disk_io_time_seconds_total -
    node_disk_io_now -
    node_context_switches_total -
    node_boot_time_seconds -
    process_resident_memory_bytes 即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换出的内存页面,但包含共享内存。
    node_intr_total -
    node_load1 -
    go_goroutines 通过runtime.NumGoroutine()调用获取,基于调度器结构sched和全局allglen变量计算得来。由于sched结构体的所有字段可能并发的更改,因此最后会检查计算的值是否小于1,如果小于1,那么返回1。
    scrape_duration_seconds -
    node_load15 -
    scrape_samples_post_metric_relabeling -
    node_netstat_Tcp_PassiveOpens -
    scrape_samples_scraped -
    node_netstat_Tcp_CurrEstab -
    scrape_series_added -
    node_netstat_Tcp_ActiveOpens -
    node_memory_MemTotal_bytes -
    node_memory_MemFree_bytes -
    node_memory_MemAvailable_bytes -
    node_memory_Cached_bytes -
    up -
    node_memory_Buffers_bytes -
  • GPU任务类型(Job)的任务名称和基础指标如下:
    任务名称(Job Name) 指标名称 指标描述
    gpu-exporter go_gc_duration_seconds 数据来自调用debug.ReadGCStats(),调用该函数时,会将传入参数GCStats结构体的PauseQuantile字段设置为5,这样函数将会返回最小、25%、50%、75% 和最大这5个GC暂停时间百分位数。然后prometheus Go客户端根据返回的GC暂停时间百分位数、以及NumGC和PauseTotal变量创建摘要类型指标。
    promhttp_metric_handler_requests_total -
    scrape_series_added -
    up -
    scrape_duration_seconds -
    scrape_samples_scraped -
    scrape_samples_post_metric_relabeling -
    go_memstats_mcache_inuse_bytes 显示mcache结构体使用的内存大小。
    process_virtual_memory_max_bytes -
    process_virtual_memory_bytes 即VSS(Virtual Set Size),指的虚拟内存集,是全部分配的内存,包括分配但未使用的内存、共享内存、换出的内存。
    process_start_time_seconds 使用到start_timestart_time描述了进程启动时的时间,单位是jiffies,数据来自/proc/stat。最后将start_time除以USER_HZ得到以秒为单位的值。
    go_memstats_next_gc_bytes 显示下个GC循环时候,堆占用内存大小。GC的目标是保证go_memstats_heap_alloc_bytes小于此值。
    go_memstats_heap_objects 显示有多少对象是堆上在分配的,会随着GC和新对象的分配而改变。
    process_resident_memory_bytes 即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换出的内存页面,但包含共享内存。
    process_open_fds 通过计算/proc/PID/fd目录下的文件总数得来。显示了Go进程当前打开的常规文件、套接字、伪终端总数。
    process_max_fds 读取/proc/{PID}/limits 文件中,Max Open Files所在行的值获得,该值是软限制(Soft Limit),软限制是内核为相应资源强制执行的值,而硬限制(Hard Limit)充当软限制的上限。
    go_memstats_other_sys_bytes 显示用于其他运行时分配占用内存大小。
    go_gc_duration_seconds_count -
    go_memstats_heap_alloc_bytes 该指标展示了在堆上为对象分配了多少字节的内存。该指标包括所有可达(reachable)堆对象和不可达(unreachable)对象(GC尚未释放的)占用的内存大小。
    process_cpu_seconds_total 该指标计算使用到utime(Go进程执行在用户态模式下的滴答数)和stime(Go进程执行在内核态时候的滴答数,例如系统调用时),他们的单位jiffies,jiffy 描述了两次系统定时器中断之间的滴答时间。process_cpu_seconds_total等于utime和stime之和除以USER_HZ。即将程序滴答总数除以 Hz(每秒滴答数)得到就是操作系统运行该进程的总时间(以秒为单位)。
    nvidia_gpu_temperature_celsius -
    go_memstats_stack_inuse_bytes 显示栈内存Span上已使用的内存大小,该Span上面至少分配了一个栈对象。
    nvidia_gpu_power_usage_milliwatts -
    nvidia_gpu_num_devices -
    nvidia_gpu_memory_used_bytes -
    nvidia_gpu_memory_total_bytes -
    go_memstats_stack_sys_bytes 显示从操作系统中获得多少字节的栈内存。是go_memstats_stack_inuse_bytes 加上操作系统线程栈得到。
    nvidia_gpu_memory_allocated_bytes -
    nvidia_gpu_duty_cycle -
    nvidia_gpu_allocated_num_devices -
    promhttp_metric_handler_requests_in_flight -
    go_memstats_sys_bytes 该指标用于衡量Go从系统中总共获取了多少字节的内存。
    go_memstats_gc_sys_bytes 显示垃圾收集元数据占用内存大小。
    go_memstats_gc_cpu_fraction 显示自程序启动以来,GC所占用CPU时间的比例。
    go_memstats_heap_released_bytes 显示有多少空闲Span已归还操作系统。
    go_memstats_frees_total 是一个计数器值,用于显示有多个堆对象被释放。可以使用rate()函数计算堆对象释放速率。同时可以通过go_memstats_mallocs_total – go_memstats_frees_total得到存活的堆对象数量。
    go_threads 通过runtime.CreateThreadProfile()调用获取,读取的是全局allm变量。
    go_memstats_mspan_sys_bytes 显示从操作系统中分配的,用于mspan结构体的内存大小。
    go_memstats_buck_hash_sys_bytes 显示用于Profiling的哈希表占用的内存大小。
    go_memstats_alloc_bytes_total 该指标随着对象在堆中分配而增加,但在释放对象时并不会减少。类似Prometheus的计数器类型,对该指标可以使用rate()来获取内存消耗速度。
    go_memstats_heap_sys_bytes 该指标显示从操作系统中为堆分配的内存字节数。它包括已保留但尚未使用的虚拟地址空间
    go_memstats_mspan_inuse_bytes 显示mspan结构体使用的内存大小。
    go_memstats_alloc_bytes 该指标展示了在 上为对象分配了多少字节的内存。该值与go_memstats_heap_alloc_bytes相同。该指标包括所有可达(reachable)堆对象和不可达(unreachable)对象(GC尚未释放的)占用的内存大小。
    go_info 该指标提供了Go版本信息。该指标数据来自runtime.Version()
    go_memstats_last_gc_time_seconds 上一次GC完成时的时间戳。
    go_memstats_heap_inuse_bytes 显示正在使用的Span占用字节数。
    go_memstats_mcache_sys_bytes 显示从操作系统分配的,用于mcache结构体的内存大小。
    go_memstats_lookups_total 是一个计数器值,用于计算有多少指针解引用。可以使用rate()函数来计算指针解引用速率。
    go_memstats_mallocs_total 是一个计数器值,用于显示有多少堆对象进行分配了。可以使用rate()函数来计算堆对象分配速率。
    go_gc_duration_seconds_sum -
    go_goroutines 通过runtime.NumGoroutine()调用获取,基于调度器结构sched和全局allglen变量计算得来。由于sched结构体的所有字段可能并发的更改,因此最后会检查计算的值是否小于1,如果小于1,那么返回1。
    go_memstats_heap_idle_bytes 显示空闲Span占用的内存字节数。
  • PV任务类型(Job)的任务名称和基础指标如下:
    任务名称(Job Name) 指标名称
    k8s-csi-cluster-pv cluster_pvc_detail_num_total
    cluster_pv_detail_num_total
    cluster_pv_status_num_total
    cluster_scrape_collector_success
    cluster_scrape_collector_duration_seconds
    alibaba_cloud_storage_operator_build_info
    cluster_pvc_status_num_total
    scrape_duration_seconds
    scrape_samples_post_metric_relabeling
    scrape_samples_scraped
    scrape_series_added
    up
    k8s-csi-node-pv cluster_scrape_collector_duration_seconds
    cluster_scrape_collector_success
    alibaba_cloud_csi_driver_build_info
    up
    scrape_series_added
    scrape_samples_post_metric_relabeling
    scrape_samples_scraped
    scrape_duration_seconds

Prometheus实例 for 云服务(即云服务类型的Prometheus实例)支持的基础指标如下表所示。

指标分类 指标名称 指标说明
ECS cpu_util_lization (ECS)CPU使用率
internet_in_rate (ECS)公网流入流量平均速率
internet_out_rate (ECS)公网流出流量平均速率
disk_read_bps (ECS)所有磁盘读取BPS
disk_write_bps (ECS)所有磁盘每秒读取次数
vpc_public_ip_internet_in_Rate (ECS)IP维度公网流入平均速率
vpc_public_ip_internet_out_Rate (ECS)IP维度公网流出带宽使用率
cpu_total (Agent)cpu.total
memory_totalspace (Agent)memory.total.space
memory_usedutilization (Agent)memory.used.utilization
diskusage_utilization (Agent)disk.usage.utilization_device
RDS cpu_usage_average CPU使用率
disk_usage 磁盘使用率
iops_usage IOPS使用率
connection_usage 连接数使用率
data_delay 只读实例延迟
memory_usage 内存使用率
mysql_network_in_new MySQL网络流入带宽
mysql_network_out_new MySQL网络流出带宽
mysql_active_sessions MySQL_ActiveSessions
sqlserver_network_in_new SQLServer网络流入带宽
sqlserver_network_out_new SQLServer网络流出带宽
NAT snat_connection SNAT连接数
snat_connection_drop_limit 历史累积最大限制丢弃连接数
snat_connection_drop_rate_limit 历史累积新建限制丢弃连接数
net_rx_rate 流入带宽
net_tx_rate 流出带宽
net_rx_pkgs 流入包速率
net_tx_pkgs 流出包速率
RocketMQ consumer_lag_gid 消息堆积
receive_message_count_gid Consumer(GroupId) 每分钟接收消息数量
send_message_count_gid Producer(GroupId) 每分钟发送消息的数量
consumer_lag_topic 消息堆积(GroupID&Topic)
receive_message_count_topic Consumer(GroupId&Topic) 每分钟接收消息数量
send_message_count_topic Producer(GroupId&Topic) 每分钟发送消息数量
receive_message_count 每分钟接收消息数量
send_message_count 每分钟发送消息数量
SLB healthy_server_count 后端健康ECS实例个数
unhealthy_server_count 后端异常ECS实例个数
packet_tx 每秒流入数据包数
packet_rx 每秒流出数据包数
traffic_rx_new 流入带宽
traffic_tx_new 流出带宽
active_connection TCP活跃连接数
inactive_connection 端口非活跃连接数
new_connection TCP新建连接数
max_connection 端口并发连接数
instance_active_connection 实例活跃连接数
instance_new_connection 实例每秒新建连接数
instance_max_connection 实例每秒最大并发连接数
instance_drop_connection 实例每秒丢失连接数
instance_traffic_rx 实例每秒入bit数
instance_traffic_tx 实例每秒出bit数
E-MapReduce(EMR) active_applications active状态的作业个数
active_users active的用户数
aggregate_containers_allocated 总共分配的container个数
aggregate_containers_released 总共释放的container个数
allocated_containers 分配的container个数
apps_completed 已完成的作业数
apps_failed 失败的作业数
apps_killed 被杀死的作业数
apps_pending 等待的作业数
apps_running 运行中的作业数
apps_submitted 提交的作业数
available_mb 当前队列当前可用的内存大小
available_vcores 当前队列可用的VCore个数
pending_containers 等待的container个数
reserved_containers 预留的container个数
EIP net_rx_rate 流入带宽
net_tx_rate 流出带宽
net_rx_pkgs_rate 流入包速率
net_tx_pkgs_rate 流出包速率
out_ratelimit_drop_speed 限速丢包速率
OSS availability 可用性
request_valid_rate 有效请求率
success_rate 成功请求占比
network_error_rate 网络错误请求占比
total_request_count 总请求数
valid_count 有效请求数
internet_send 公网流出流量
internet_recv 公网流入流量
intranet_send 内网流出流量
intranet_recv 内网流入流量
success_count 成功请求总数
network_error_count 网络错误请求总数
client_timeout_count 客户端超时错误请求总数
Elasticsearch(ES) node_cpu_utilization Elasticsearch实例节点CPU使用率
node_heap_memory_utilization Elasticsearch实例节点HeapMemory使用率
node_stats_exception_log_count Exception次数
node_stats_full_gc_collection_count FullGc次数
node_disk_utilization Elasticsearch实例节点磁盘使用率
node_load_1m 节点Load_1m
cluster_query_qps 集群查询QPS
cluster_index_qps ClusterIndexQPS
Logstash cpu_percent Logstash实例节点CPU使用率
node_heap_memory 节点内存使用量
node_disk_usage Logstash实例节点磁盘使用率
DRDS cpu_utilization CPU使用率
connection_count 连接数
logic_qps 逻辑QPS
logic_rt 逻辑RT
memory_utilization 内存利用率
network_input_traffic 网络输入带宽
network_output_traffic 网络输出带宽
physics_qps 物理QPS
physics_rt 物理RT
thread_count 活跃线程数
com_insert_select 私有RDS_MySQL每秒InsertSelect量
com_replace 私有RDS_MySQL每秒Replace量
com_replace_select 私有RDS_MySQL每秒ReplaceSelect量
com_select 私有RDS_MySQL每秒Select量
com_update 私有RDS_MySQL每秒Update量
conn_usage 私有RDS_MySQL连接数利用率
cpu_usage 私有RDS_MySQL CPU使用率
disk_usage 私有RDS_MySQL磁盘使用率
ibuf_dirty_ratio 私有RDS_MySQL_BP脏页百分率
ibuf_pool_reads 私有RDS_MySQL每秒物理读次数
ibuf_read_hit 私有RDS_MySQL_BP读命中率
ibuf_request_r 私有RDS_MySQL每秒逻辑读次数
ibuf_request_w 私有RDS_MySQL每秒逻辑写次数
ibuf_use_ratio 私有RDS_MySQL_BP利用率
inno_data_read 私有RDS_MySQL_InnoDB每秒读取数据量
inno_data_written 私有RDS_MySQL_InnoDB每秒写入数据量
inno_row_delete 私有RDS_MySQL_InnoDB每秒删除行数
inno_row_insert 私有RDS_MySQL_InnoDB每秒插入行数
inno_row_readed 私有RDS_MySQL_InnoDB每秒读取行数
inno_row_update 私有RDS_MySQL_InnoDB每秒更新行数
innodb_log_write_requests 私有RDS_MySQL_InnoDB每秒日志写请求次数
innodb_log_writes 私有RDS_MySQL_InnoDB每秒日志物理写次数
innodb_os_log_fsyncs 私有RDS_MySQL_InnoDB每秒日志fsync量
input_traffic_ps 私有RDS_MySQL网络流入带宽
iops_usage 私有RDS_MySQL IOPS利用率
mem_usage 私有RDS_MySQL内存利用率
output_traffic_ps 私有RDS_MySQL网络流出带宽
qps 私有RDS_MySQL每秒查询量
slave_lag 私有RDS_MySQL只读实例延迟
slow_queries 私有RDS_MySQL每秒慢查询量
tb_tmp_disk 私有RDS_MySQL每秒创建临时表数量
Kafka instance_disk_capacity 实例磁盘使用率
instance_message_input 实例消息生产量
instance_message_output 实例消息消费量
topic_message_input Topic消息生产量
topic_message_output Topic消息消费量
MongoDB cpu_utilization CPU使用率
memory_utilization 内存使用百分比
disk_utilization 磁盘使用率
iops_utilization IOPS使用率
qps 每秒请求数
connect_amount 连接数使用量
instance_disk_amount 实例占用磁盘空间量
data_disk_amount 数据占用磁盘空间量
log_disk_amount 日志占用磁盘空间量
intranet_in 内网网络入流量
intranet_out 内网网络出流量
number_requests 请求数
op_insert Insert操作次数
op_query Query操作次数
op_update Update操作次数
op_delete Delete操作次数
op_getmore Getmore操作次数
op_command Command操作次数
PolarDB active_connections 活跃连接数
blks_read_delta 数据块读取数
cluster_active_sessions 活跃连接数
cluster_connection_utilization 连接数使用率
cluster_cpu_utilization CPU使用率
cluster_data_io 每秒存储引擎IO吞吐量
cluster_data_iops 每秒存储引擎IO次数
cluster_mem_hit_ratio 内存命中率
cluster_memory_utilization 内存使用率
cluster_qps 每秒查询数量
cluster_slow_queries_ps 每秒慢查询数量
cluster_tps 每秒事务数
conn_usage 连接使用率
cpu_total CPU使用率
db_age 数据库最大年龄
instance_connection_utilization 实例连接数使用率
instance_cpu_utilization 实例CPU使用率
instance_input_bandwidth 实例输入带宽
instance_memory_utilization 实例内存使用率
instance_output_bandwidth 实例输出带宽
mem_usage 内存利用率
pls_data_size pg数据盘大小
pls_iops pg IOPS
pls_iops_read pg读IOPS
pls_iops_write pg写IOPS
pls_pg_wal_dir_size pg WAL日志大小
pls_throughput pg IO吞吐
pls_throughput_read pg读IO吞吐
pls_throughput_write pg写IO吞吐
swell_time pg膨胀点
tps pg TPS
cluster_iops 每秒IO次数
Redis intranet_in_ratio 写入带宽使用率
intranet_out_ratio 读取带宽使用率
failed_count 操作失败数
cpu_usage CPU使用率
used_memory 内存使用量
used_connection 已用连接数
used_qps 已用QPS数量

Prometheus监控支持的消息队列RocketMQ版云服务的基础指标如下表所示。

指标分类 指标名称 指标说明
生产者 rocketmq_producer_requests 发送相关API调用次数
rocketmq_producer_messages 发送消息量
rocketmq_producer_message_size_bytes 发送消息的总大小
rocketmq_producer_send_success_rate 发送消息成功率
rocketmq_producer_failure_api_calls 发送API调用失败次数
rocketmq_producer_send_rt_milliseconds_avg 发送消息耗时平均值
rocketmq_producer_send_rt_milliseconds_min 发送消息耗时最小值
rocketmq_producer_send_rt_milliseconds_max 发送消息耗时最大值
rocketmq_producer_send_rt_milliseconds_p95 发送消息耗时P95值
rocketmq_producer_send_rt_milliseconds_p99 发送消息耗时P99值
消费者 rocketmq_consumer_requests 消费消息相关API调用次数
rocketmq_consumer_send_back_requests 消费者消费失败回发接口调用次数
rocketmq_consumer_send_back_messages 消费者消费失败回发的消息
rocketmq_consumer_messages 消费消息量
rocketmq_consumer_message_size_bytes 消费消息量大小(一分钟累积量)
rocketmq_consumer_ready_and_inflight_messages 消息消费滞后量(包括已就绪消息量和处理中消息量)
rocketmq_consumer_ready_messages 已就绪消息量
rocketmq_consumer_inflight_messages 处理中消息量
rocketmq_consumer_queue_time_milliseconds 消息排队时间
rocketmq_consumer_message_await_time_milliseconds_avg 消息在消费者客户端等待处理资源耗时平均值
rocketmq_consumer_message_await_time_milliseconds_min 消息在消费者客户端等待处理资源耗时最小值
rocketmq_consumer_message_await_time_milliseconds_max 消息在消费者客户端等待处理资源耗时最大值
rocketmq_consumer_message_await_time_milliseconds_p95 消息在消费者客户端等待处理资源耗时P95值
rocketmq_consumer_message_await_time_milliseconds_p99 消息在消费者客户端等待处理资源耗时P99值
rocketmq_consumer_message_process_time_milliseconds_avg 消费者处理消息耗时平均值
rocketmq_consumer_message_process_time_milliseconds_min 消费者处理消息耗时最小值
rocketmq_consumer_message_process_time_milliseconds_max 消费者处理消息耗时最大值
rocketmq_consumer_message_process_time_milliseconds_p95 消费者处理消息耗时P95值
rocketmq_consumer_message_process_time_milliseconds_p99 消费者处理消息耗时P99值
rocketmq_consumer_consume_success_rate 消费消息成功率
rocketmq_consumer_failure_api_calls 消费API调用失败次数
rocketmq_consumer_to_dlq_messages 进死信消息量
Overview rabbitmq_instance_api_total 实例级别API调用次数,秒级别
rabbitmq_connections_opened_total 已打开的连接总数
rabbitmq_connections_closed_total 已关闭的连接总数
rabbitmq_channels_opened_total 打开的通道总数
rabbitmq_channels_closed_total 关闭的通道总数
rabbitmq_queues_declared_total 声明的队列总数
rabbitmq_queues_deleted_total 删除的队列总数
rabbitmq_exchange_declared_total -
rabbitmq_exchange_deleted_total -
rabbitmq_exchange_bind_total -
rabbitmq_exchange_unbind_total -
rabbitmq_queue_bind_total -
rabbitmq_queue_unbind_total -
rabbitmq_connections 当前打开的连接
rabbitmq_channels 目前开放的渠道
Connections rabbitmq_connection_channels 连接上的通道
Exchange rabbitmq_exchange_messages_published_in_total 流入消息量
rabbitmq_exchange_messages_published_out_total 流出消息量
Queues rabbitmq_queue_messages_published_total 发布到队列的消息总数
rabbitmq_queue_messages_ready 准备好交付给消费者的消息量
rabbitmq_queue_messages_unacked 定时中的消息量
rabbitmq_queue_deliver_total 已传递给消费者但尚未确认的消息总数
rabbitmq_queue_get_total -
rabbitmq_queue_ack_total -
rabbitmq_queue_uack_total -
rabbitmq_queue_recover_total -
rabbitmq_queue_reject_total -
rabbitmq_queue_consumers 队列中的消费者