高级监控报警服务能够为您提供丰富的Elasticsearch指标,其中基础指标不仅包含集群状态、节点及索引数量等资源使用指标和集群或节点的写入与读取QPS等并发性能指标,还包括资源使用情况和网络监控指标等,能够帮助您更好地掌握Elasticsearch集群的使用情况。通过使用高级监控报警服务,您不仅可以查看集群基础指标大盘,还可以自定义相关报警规则,实时监控集群性能并发送报警通知。本文为您介绍默认基础指标大屏中各监控项中的指标含义。

表 1. 基础指标及含义
类别 指标 含义
cluster aliyunes.elasticsearch.index.summary.total.indexing.index_total_qps 集群总体写入QPS。
aliyunes.elasticsearch.index.summary.total.search.query_total_qps 集群总体读取QPS。
aliyunes.elasticsearch.cluster.stats.status 集群状态,支持以下三种状态:
  • 0:green
  • 1:yellow
  • 2:red
aliyunes.elasticsearch.cluster.stats.indices.shards.count shard数目。
aliyunes.elasticsearch.cluster.stats.indices.total index数目。
aliyunes.elasticsearch.cluster.stats.nodes.count 节点数目。
aliyunes.elasticsearch.aliyun_auto_snapshot.latest_duration.ms 最新快照持续时长,单位:ms。
aliyunes.elasticsearch.cluster.stats.indices.fielddata.memory.bytes fielddata内存使用情况,单位:Byte。
aliyunes.elasticsearch.cluster.stats.indices.shards.primaries 主shard数目。
index aliyunes.elasticsearch.index.indexing.index_total index写入QPS。
aliyunes.elasticsearch.index.search.query_total index查询QPS。
aliyunes.elasticsearch.index.indexing.index_time.ms index耗时,单位:ms。
aliyunes.elasticsearch.index.search.query_time.ms 查询耗时,单位:ms。
aliyunes.elasticsearch.index.segments.memory.bytes index segments内存使用情况,单位:Byte。
aliyunes.elasticsearch.index.store.size.bytes 索引存储大小,单位:Byte。
aliyunes.elasticsearch.index.segments.stored_fields_memory.bytes segments stored fields的内存大小,单位:Byte。
aliyunes.elasticsearch.index.segments.count index segments数目。
Node Resource aliyunes.ecs.node_stats_process_cpu_percent_raw 节点的CPU平均使用率。
aliyunes.ecs.node_stats_os_cpu_load_average_1m_raw 节点每分钟负载。
aliyunes.ecs.node_stats_os_per_cpu_load_average_1m_raw 节点单CPU每分钟负载。
aliyunes.elasticsearch.node.stats.jvm.mem.heap_used_percent JVM堆内存使用率。
aliyunes.ecs.node_stats_system_disk_space_usage 系统磁盘使用率。
aliyunes.ecs.node_stats_fs_data_disk_total_usage 节点磁盘使用率。
Node Network aliyunes.ecs.node_stats_networkin_packages 节点网络流入包。
aliyunes.ecs.node_stats_networkout_packages 节点网络流出包。
aliyunes.ecs.node_stats_networkin_rate 数据流入率。
aliyunes.ecs.node_stats_networkout_rate 节点网络流出率。
aliyunes.ecs.node_stats_tcp_established 节点TCP链接数。
Node Disk aliyunes.ecs.node_stats_data_disk_r 每秒完成的读请求数量。
aliyunes.ecs.node_stats_data_disk_rm 每秒钟读取的大小,单位:MB。
aliyunes.ecs.node_stats_data_disk_w 每秒完成的写请求数量。
aliyunes.ecs.node_stats_data_disk_wm 每秒钟写入的大小,单位:MB。
aliyunes.ecs.node_stats_data_disk_r_await 平均每次读请求的等待时间,单位:ms。
aliyunes.ecs.node_stats_data_disk_w_await 平均每次写请求的等待时间,单位:ms。
aliyunes.ecs.node_stats_data_disk_svctm 平均每次请求的服务时间,单位:ms。
aliyunes.ecs.node_stats_data_disk_util 设备的利用率。
aliyunes.ecs.node_stats_data_disk_avgqu_sz 平均请求队列的长度。
Node JVM aliyunes.elasticsearch.node.stats.jvm.mem.heap_used_percent heap使用率。
aliyunes.elasticsearch.node.stats.jvm.mem.pools.old.used.bytes old区使用情况,单位:Byte。
aliyunes.elasticsearch.node.stats.jvm.gc.collectors.old.collection.ms old GC耗时,单位:ms。
aliyunes.elasticsearch.node.stats.jvm.gc.collectors.young.collection.ms young GC耗时,单位:ms。
aliyunes.elasticsearch.node.stats.jvm.gc.collectors.old.collection.count old GC频次。
aliyunes.elasticsearch.node.stats.jvm.gc.collectors.young.collection.count young GC频次。
aliyunes.elasticsearch.node.stats.jvm.mem.pools.survivor.used.bytes survivor空间当前使用的内存量,单位:Byte。
aliyunes.elasticsearch.node.stats.jvm.mem.pools.survivor.max.bytes survivor空间使用的最大内存量,单位:Byte。
aliyunes.elasticsearch.node.stats.jvm.mem.pools.old.peak.bytes JVM老年代空间使用的最大内存,单位:Byte。
aliyunes.elasticsearch.node.jvm.memory.nonheap.init.bytes JVM初始化堆外内存,单位:Byte。
aliyunes.elasticsearch.node.jvm.memory.nonheap.max.bytes 堆外内存最大使用量,单位:Byte。
Thread_pool aliyunes.elasticsearch.node.stats.thread_pool.search.threads 线程池中的线程总数。
aliyunes.elasticsearch.node.stats.thread_pool.search.rejected 查询线程池中被拒绝的请求数。
aliyunes.elasticsearch.node.stats.thread_pool.search.queue 查询线程池中排队的请求数。
aliyunes.elasticsearch.node.stats.thread_pool.generic.queue 通用线程池中排队的请求数。
aliyunes.elasticsearch.node.stats.thread_pool.generic.threads 通用池中的线程总数。
aliyunes.elasticsearch.node.stats.thread_pool.generic.rejected 通用线程池中被拒绝的请求数。
说明 cluster、index、Node JVM、Thread_pool维度涉及到的指标,均由Elasticsearch模块自身提供,具体请参见Elasticsearch Fields