本文介绍了ARMS应用监控中常见的指标说明。

业务类指标

公共维度

维度名称维度Key
服务名称service
服务PIDpid
机器IPserverIp
接口rpc

指标列表

所有访问类型都包含下列指标,执行查询操作时,只需要将$callType替换为具体的访问类型即可。详细的访问类型,请参见服务访问类型及可用维度

例如:需要查询HTTP服务的请求数时, 只需将arms_$callType_requests_count修改为arms_http_requests_count

指标名称指标指标类型采集间隔单位维度
总请求数arms_$callType_requests_countGauge15s不同服务访问类型维度不同,详细信息,请参见服务访问类型及可用维度
错误请求数arms_$callType_requests_error_countGauge15s
总请求耗时arms_$callType_requests_secondsGauge15s
慢请求数arms_$callType_requests_slow_countGauge15s
总请求耗时分位数arms_$callType_requests_latency_secondsSummary15s仅当服务访问类型为HTTP且开启分位数统计的情况下存在。开启分位数统计的操作,请参见高级设置

Quantile分数位维度:

  • 0.5
  • 0.75
  • 0.90
  • 0.99

JVM指标

公共维度

维度名称维度Key
服务名称service
服务PIDpid
机器IPserverIp

指标列表

指标名称指标指标类型采集间隔单位维度
累计GC发生次数arms_jvm_gc_totalCounter15sGen GC发生区域:
  • Young:年轻代
  • Old:老年代
累计GC耗时arms_jvm_gc_seconds_totalCounter15s
两次采集间隔之间的GC次数arms_jvm_gc_deltaGauge15s
两次采集间隔之间的GC耗时arms_jvm_gc_seconds_deltaGauge15s
JVM线程数arms_jvm_threads_countGauge15sState线程状态:
  • Blocked:阻塞状态
  • Live:活跃状态
  • Daemon:守护状态
  • New:初始状态
  • Dead-lock:死锁状态
  • Runnable:运行状态
  • Terminated:终止状态
  • Timed-wait:超时等待状态
  • Wait:等待状态
JVM内存区域初始大小arms_jvm_mem_init_bytesGauge15s字节Area区域:
  • Heap:堆区
  • Nonheap:非堆区
  • Total:总计

ID区域细分:

  • Eden:伊甸区
  • Old:老年代
  • Survivor:幸存者区
  • Metaspace:元数据区
  • Code cache:代码缓存区
  • Compressed class space:压缩类空间
  • Total:总计
JVM内存区域最大大小arms_jvm_mem_max_bytesGauge15s字节
JVM内存区域使用大小arms_jvm_mem_used_bytesGauge15s字节
JVM内存区域已提交大小arms_jvm_mem_committed_bytesGauge15s字节
JVM内存区域使用比例arms_jvm_mem_usage_ratioGauge15s比例(0~1)
JVM已加载类arms_class_load_loadedCounter15s
JVM已卸载类arms_class_load_un_loadedCounter15s
JVM缓存池大小arms_jvm_buffer_pool_total_bytesGauge15s字节ID区域:
  • Direct
  • Mapped
JVM缓存池已使用大小arms_jvm_buffer_pool_used_bytesGauge15s字节
JVM缓存池个数arms_jvm_buffer_pool_countGauge15s
文件描述符打开个数arms_file_desc_open_countGauge15s
文件描述符打开比例(已打开数/最大允许打开数)arms_file_desc_open_ratioGauge15s比例(0~1)

系统指标

公共维度

维度名称维度Key
服务名称service
服务PIDpid
机器IPserverIp

指标列表

指标名称指标指标类型采集间隔单位
空闲CPU占比arms_system_cpu_idleGauge15s百分数
IO等待CPU占比arms_system_cpu_io_waitGauge15s百分数
系统CPU占比arms_system_cpu_systemGauge15s百分数
用户态CPU占比arms_system_cpu_userGauge15s百分数
系统负载(1分钟)arms_system_loadGauge15s
磁盘空闲大小arms_system_disk_free_bytesGauge15s字节
磁盘总大小arms_system_disk_total_bytesGauge15s字节
磁盘使用率arms_system_disk_used_ratioGauge15s比例(0~1)
内存Buffer大小arms_system_mem_buffers_bytesGauge15s字节
内存缓存大小arms_system_mem_cached_bytesGauge15s字节
内存空闲大小arms_system_mem_free_bytes Gauge15s字节
内存交换区空闲大小arms_system_mem_swap_free_bytes Gauge15s字节
内存交换区大小arms_system_mem_swap_total_bytesGauge15s字节
内存大小arms_system_mem_total_bytesGauge15s字节
已用内存大小arms_system_mem_used_bytes Gauge15s字节
网络接收流量大小arms_system_net_in_bytesGauge15s字节
网口发送流量大小arms_system_net_out_bytesGauge15s字节
网络入口错误数arms_system_net_in_errGauge15s
网络出口错误数arms_system_net_out_errGauge15s

线程池指标

公共维度

维度名称维度Key
服务名称service
服务PIDpid
机器IPserverIp
线程池名称name
线程池类型type

指标列表

指标名称指标指标类型采集间隔维度
线程池核心线程数arms_threadpool_core_sizeGauge15s
线程池最大线程数arms_threadpool_max_sizeGauge15s
线程池活跃线程数arms_threadpool_active_sizeGauge15s
线程池队列大小arms_threadpool_queue_sizeGauge15s
线程池当前大小arms_threadpool_current_sizeGauge15s
线程池不同状态任务数arms_threadpool_task_totalGauge15sStatus任务状态:
  • Scheduled:已调度
  • Completed:完成
  • Rejected:拒绝

定时任务指标

仅定时任务存在以下指标。

公共维度

维度名称维度Key
服务名称service
服务PIDpid
机器IPserverIp
任务IDrpc

指标列表

指标名称指标指标类型采集间隔单位
调度延迟arms_$callType_delay_millisecondsGauge15s毫秒

服务访问类型及可用维度

客户端类

  • 访问类型
    • http_client
    • dubbo_client
    • hsf_client
    • dsf_client
    • notify_client
    • grpc_client
    • thrift_client
    • sofa_client
    • mq_client
    • kafka_client
  • 维度
    • parent:上游服务的名称
    • ppid:上游服务PID
    • destId:请求对端扩展信息
    • endpoint:请求对端地址
    • excepType:异常ID
    • excepInfo:异常ID编码规则
    • excepName:异常名称
    • stackTraceId:异常栈ID

DB类

  • 访问类型
    • mysql
    • oracle
    • mariadb
    • postgresql
    • ppas
    • sqlserver
    • mongodb
    • dmdb
  • 维度
    • parent:上游服务的名称
    • ppid:上游服务PID
    • destId:数据库名称
    • endpoint:数据库地址
    • excepType:异常ID
    • excepInfo:异常ID编码规则
    • excepName:异常名称
    • stackTraceId:异常栈ID
    • sqlId:SQL语句ID

服务端类

  • 访问类型
    • http
    • dubbo
    • hsf
    • dsf
    • user_method
    • mq
    • kafka
    • grpc
    • thrift
    • sofa
  • 维度
    • prpc:上游接口
    • parent:上游服务的名称
    • ppid:上游服务PID
    • endpoint:服务地址
    • excepType:异常ID
    • excepInfo:异常ID编码规则
    • excepName:异常名称
    • stackTraceId:异常栈ID

定时任务类

  • 访问类型
    • xxl_job
    • spring_scheduled
    • quartz
    • elasticjob
    • jdk_timer
    • schedulerx
  • 维度
    • prpc:上游接口
    • parent:上游服务的名称
    • ppid:上游服务PID
    • excepType:异常ID
    • excepInfo:异常ID编码规则
    • excepName:异常名称
    • stackTraceId:异常栈ID