高级监控报警服务能够为您提供丰富的Elasticsearch指标,其中引擎指标是基于阿里云工程师丰富的运维经验,自主研发和采集的包括集群状态、查询、写入和缓存等方面的各项指标,能够帮助您排查Elasticsearch集群引擎性能及稳定性问题。使用高级监控报警服务,您不仅可以查看集群引擎指标大盘,还可以自定义相关报警规则,实时监控集群性能并发送报警通知。本文为您介绍阿里云Elasticsearch各引擎指标的含义。

使用限制

阿里云Elasticsearch实例的版本不同,支持的高级监控指标也不同。仅6.7和7.10版本实例(包含日志增强版和商业版)支持index写入和查询QPS相关指标,仅6.7日志增强版实例不支持磁盘使用率相关指标。具体支持的指标请以控制台为准。

概览

标签(表头)说明

  • 指标:用于展示高级监控报警可供配置的各引擎指标。配置报警规则时需要填写指标,您可以复制此指标并粘贴到搜索框内,系统会自动为您匹配对应指标,详细信息请参见配置报警规则
  • 指标含义:控制台中显示的指标含义。
  • 说明:指标的详细说明。
  • Tags:配置报警规则时,各监控项支持包含哪些属性标签。
    说明
    • 不同的指标支持不同粒度的Tags。通过配置Tags,您可以进一步过滤指标数据。
    • 以下Tags在通用Tags属性(instanceId、ip)的基础上,进行了更细粒度的划分。未提到的Tags不在Elasticsearch的监控范围内,例如hostname、kmon_tenant_name、kmon_service_name。
  • 聚合算子:
    • 指标聚合:所选Tags内的指标值采用的聚合方式。
    • 采样聚合:对采样周期内的数据采用的聚合方式。

overview(概况)

指标指标含义说明Tags聚合算子
elasticsearch-server.search_total端到端查询QPS每秒端到端查询次数。

例如客户端每秒发送两个查询index的请求,则search_total为2。

  • instanceId
  • es_region
  • 指标聚合:sum()
  • 采样聚合:avg()
elasticsearch-server.search_time_in_millis.max端到端查询延迟max端到端查询延迟时间。
  • instanceId
  • es_region
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.bulk_total_operationsbulk请求tpsshard维度,每秒bulk操作的次数。
  • instanceId
  • es_region
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.bulk_total_time_in_millis.maxbulk请求延迟maxshard维度,bulk操作总耗时。
  • instanceId
  • es_region
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.search_aggregation_total端到端agg查询QPS每秒端到端聚合查询的次数。

例如客户端每秒发送两个聚合查询请求,则aggregation_total为2。

  • instanceId
  • es_region
  • 指标聚合:sum()
  • 采样聚合:avg()

search(查询)

指标指标含义说明Tags聚合算子
elasticsearch-server.search_total索引端到端查询QPS索引间每秒端到端查询次数。

例如客户端每秒发送两个查询index的请求,则search_total为2。

  • instanceId
  • index
  • es_region
  • 指标聚合:sum()
  • 采样聚合:avg()
elasticsearch-server.search_time_in_millis.max索引端到端查询延迟_max索引间端到端查询延迟时间。
  • instanceId
  • index
  • es_region
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.search_aggregation_total索引端到端agg查询QPS索引间每秒端到端聚合查询的次数。

例如客户端每秒发送两个聚合查询请求,则aggregation_total为2。

  • instanceId
  • index
  • es_region
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.search_total协调节点查询QPS协调节点每秒查询次数。

例如客户端每秒发送两个查询index的请求,则通过协调节点search_total为2。

  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.search_time_in_millis.max协调节点查询延迟_max协调节点查询延迟时间。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.search_aggregation_total协调节点agg查询QPS协调节点每秒聚合查询的次数。

例如客户端每秒发送两个聚合查询请求,则通过协调节点aggregation_total为2。

  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.allocated_bytes.maxnode聚合查询大对象分配速度_max聚合查询分配的内存大小。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_totalnode维度query阶段QPSnode维度整合整个节点上所有shard每秒执行查询的次数,主要与每个shard的个数有关。

例如,每个shard上,您需要查询的索引有5个主shard,则每秒执行shard查询的次数为5。

  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_took_in_millis.maxnode维度query阶段延迟maxnodes维度shard查询阶段的延迟。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.fetch_totalnode维度fetch阶段QPSnode维度shard召回阶段每秒的查询次数。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.fetch_took_in_millis.maxnode维度fetch阶段延迟maxnode维度shard召回阶段总耗时。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_totalshard维度query阶段QPSshard维度每秒执行shard查询的次数,主要与shard个数有关。

例如,您需要查询的索引有5个主shard,则每秒执行shard查询的次数为5。

  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_took_in_millis.maxshard维度query阶段延迟maxshard维度shard查询阶段的延迟时间。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.fetch_totalshard维度fetch阶段QPSshard维度shard召回阶段每秒的查询次数。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.fetch_took_in_millis.maxshard维度fetch阶段延迟maxshard维度shard召回阶段总耗时。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()

bulk(写入)

指标指标含义说明Tags聚合算子
elasticsearch-server.bulk_total_operations索引维度bulk请求tps索引维度,每秒bulk操作的次数。
  • instanceId
  • index
  • 指标聚合:sum()
  • 采样聚合:avg()
elasticsearch-server.bulk_total_time_in_millis.max索引维度bulk请求延迟max索引维度,bulk操作总耗时。
  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.bulk_avg_size_in_bytes索引维度单条bulk平均大小索引维度,单条bulk命令包含的请求平均大小。
  • instanceId
  • index
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.bulk_total_operationsnode维度bulk请求tpsnode维度,每秒bulk操作的次数。
  • instanceId
  • ip
  • 指标聚合:sum()
  • 采样聚合:avg()
elasticsearch-server.bulk_total_time_in_millis.maxnode维度bulk请求延迟maxnode维度,bulk操作总耗时。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.bulk_avg_size_in_bytesnode维度单条bulk平均大小node维度,单条bulk命令包含的请求平均大小。
  • instanceId
  • ip
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.bulk_total_operationsshard维度bulk请求tpsshard维度,每秒bulk操作的次数。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.bulk_total_time_in_millis.maxshard维度bulk请求延迟maxshard维度,bulk操作总耗时。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.bulk_avg_size_in_bytesshard维度单条bulk平均大小shard维度,单条bulk命令包含的请求平均大小。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:avg()
  • 采样聚合:avg()

时序写入Serverless

指标指标含义说明Tags聚合算子
elasticsearch-server.cube.follower_indices_throughput_in_bytes时序写入Serverless流量通过时序写入到Elasticsearch时,写入索引的流量大小。
  • indexName
  • es_region
  • 指标聚合:sum()
  • 采样聚合:avg()
elasticsearch-server.cube.follower_indices_store_size_in_bytes时序写入Serverless索引空间大小通过时序写入到Elasticsearch上,写入索引所占空间内存大小。
  • indexName
  • es_region
  • 指标聚合:sum()
  • 采样聚合:avg()

cache(缓存)

指标指标含义说明Tags聚合算子
elasticsearch-server.query_cache_shard_hit_total索引维度query_cache命中QPS从索引维度观察shard查询时,每秒命中节点缓存的查询次数。
  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_cache_shard_cached_total索引维度query_cache缓存QPS从索引维度观察shard查询时,每秒在节点缓存中新增的查询次数。
  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_cache_shard_miss_total索引维度query_cache miss QPS从索引维度观察shard查询时,每秒未命中节点缓存的查询次数。
  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_cache_shard_evictions_total索引维度query_cache踢出QPS从索引维度观察shard查询时,每秒从节点缓存中踢出的查询次数。

例如,当缓存已满时,将最近使用最少的查询结果踢出,以留出空间来存放新数据。

  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_cache_shard_hit_totalnode维度query_cache命中QPS从node维度观察shard查询时,每秒命中节点缓存的查询次数。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_cache_shard_cached_totalnode维度query_cache缓存QPS从node维度观察shard查询时,每秒在节点缓存中新增的查询次数。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_cache_shard_miss_totalnode维度query_cache miss QPS从node维度观察shard查询时,每秒未命中节点缓存的查询次数。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_cache_shard_evictions_totalnode维度query_cache踢出QPS从node维度观察shard查询时,每秒从节点缓存中踢出的查询次数。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_cache_shard_cached_size_in_bytes.maxnode维度query_cache缓存大小maxshard查询时,从node维度观察节点缓存新增数据的总大小。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_cache_shard_hit_totalshard维度query_cache命中QPSshard查询时,每秒命中节点缓存的查询次数。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_cache_shard_cached_totalshard维度query_cache缓存QPSshard查询时,每秒在节点缓存中新增的查询次数。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_cache_shard_miss_totalshard维度query_cache miss QPSshard查询时,每秒未命中节点缓存的查询次数。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_cache_shard_evictions_totalshard维度query_cache踢出QPSshard查询时,每秒从节点缓存中踢出的查询次数。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.query_cache_shard_cached_size_in_bytes.maxshard维度query_cache缓存大小maxshard查询时,缓存新增数据的总大小。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()

refresh(可见性)

指标指标含义说明Tags聚合算子
elasticsearch-server.refresh_total索引维度refresh_qps刷新动作落在索引上每秒的查询次数。
  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.refresh_interval_in_millis.max索引维度refresh间隔max每次刷新动作落在索引之间的间隔。
  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.refresh_took_in_millis.max索引维度refresh动作耗时max刷新动作落在每条索引所占用时间。
  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.refresh_totalnode维度refresh_qps刷新动作落在节点上每秒的查询次数。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.refresh_interval_in_millis.maxnode维度refresh间隔max每次刷新动作落在节点之间的间隔。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.refresh_took_in_millis.maxnode维度refresh动作耗时max刷新动作落在每个节点所占用时间。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.refresh_totalshard维度refresh_qps刷新动作落在索引shard上每秒的查询次数。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.refresh_interval_in_millis.maxshard维度refresh间隔max每次刷新动作落在索引shard之间的间隔。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.refresh_took_in_millis.maxshard维度refresh动作耗时max刷新动作落在每个索引shard所占用时间。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()

merge(合并)

指标指标含义说明Tags聚合算子
elasticsearch-server.merge_total索引维度merge_qps刷索引merge阶段每秒的查询次数。
  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.merge_took_in_millis.max索引维度merge耗时max索引merge数据时所用时间。
  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.merge_size_in_bytes.max索引维度merge大小max索引merge数据后占用的内存大小。
  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.merge_totalnode维度merge_qps各节点merge阶段每秒的查询次数。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.merge_took_in_millis.maxnode维度merge耗时max各节点merge数据时所用时间。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.merge_size_in_bytes.maxnode维度merge大小max各节点merge数据后占用的内存大小。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.merge_totalshard维度merge_qps索引shard在merge阶段每秒的查询次数。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.merge_took_in_millis.maxshard维度merge耗时max索引shard在merge数据时所用时间。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.merge_size_in_bytes.maxshard维度merge大小max索引shard在merge数据后占用的内存大小。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()

cluster state(集群元数据)

指标指标含义说明Tags聚合算子
elasticsearch-server.applied_cluster_state_countcluster_state本地应用QPSMaster节点同步集群状态给其他节点,其他节点接收成功的次数。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.applied_cluster_state_took_in_millis.maxcluster_state本地应用耗时maxMaster节点同步集群状态给其他节点,其他节点接收成功所消耗的时间。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.publish_time_in_millis.maxcluster state广播耗时max集群状态广播耗时。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.failed_cluster_state_countcluster_state本地应用失败QPSMaster节点同步集群状态给其他节点,其他节点接收失败的次数。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.failed_cluster_state_took_in_millis.maxcluster_state本地应用失败耗时maxMaster节点同步集群状态给其他节点,其他节点接收失败所消耗的时间。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.task_execution_countmaster处理task QPS集群状态变化次数。
例如当集群中存在频繁的节点变更、频繁的设置索引Mapping和Setting等操作时,Master节点都会重新计算集群状态变化次数。
重要 状态变化次数越大,说明集群或索引存在频繁的变更,可能会影响集群的稳定性。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.task_execution_time_in_millis.maxmaster处理task耗时maxMaster节点获取集群状态所消耗的时间。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.task_wait_time_in_millis.maxtask队列等待时间max每个获取集群状态的任务在Master节点的任务队列中的等待时间。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()

segment replication(物理复制)

指标指标含义说明Tags聚合算子
elasticsearch-server.segment_replication.refresh_copy_file_size索引维度增量拷贝平均大小使用物理复制功能时,每次索引维度执行refresh操作,拷贝主副本增量数据的大小。
  • instanceId
  • index
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.refresh_copy_file_sizenode维度增量拷贝平均大小使用物理复制功能时,每次node维度执行refresh操作,拷贝主副本增量数据的大小。
  • instanceId
  • ip
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.refresh_copy_file_sizeshard维度增量拷贝大小使用物理复制功能时,每次shard维度执行refresh操作,拷贝主副本增量数据的大小。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.refresh_latency_time索引维度增量拷贝延迟-avg使用物理复制功能时,每次索引维度执行refresh操作所消耗的平均值时间。
  • instanceId
  • index
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.refresh_latency_time索引维度增量拷贝延迟-max使用物理复制功能时,每次索引维度执行refresh操作所消耗的最大值时间。
  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:max()
elasticsearch-server.segment_replication.refresh_latency_timenode维度增量拷贝延迟-avg使用物理复制功能时,每次node维度执行refresh操作所消耗的平均值时间。
  • instanceId
  • ip
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.refresh_latency_timeshard维度增量拷贝延迟-avg使用物理复制功能时,每次执行refresh操作所消耗的平均值时间。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.refresh_latency_timeshard维度增量拷贝延迟-max使用物理复制功能时,每次shard维度执行refresh操作所消耗的最大值时间。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:max()
elasticsearch-server.segment_replication.merge_copy_file_size索引维度merge预拷贝平均大小使用物理复制功能时,每次索引维度merge阶段结束后,拷贝到副本的平均值数据大小。
  • instanceId
  • index
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.merge_copy_file_sizenode维度merge预拷贝平均大小使用物理复制功能时,每次node维度merge阶段结束后,拷贝到副本的平均值数据大小。
  • instanceId
  • ip
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.merge_copy_file_sizeshard维度merge预拷贝大小使用物理复制功能时,每次shard维度merge阶段结束后,拷贝到副本的平均值数据大小。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.merge_latencc索引维度merge预拷贝延迟-avg使用物理复制功能时,每次索引维度merge阶段结束后,数据拷贝到副本所消耗的平均值时间。
  • instanceId
  • index
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.merge_latencc索引维度merge预拷贝延迟-max使用物理复制功能时,每次索引维度merge阶段结束后,数据拷贝到副本所消耗的最大值时间。
  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:max()
elasticsearch-server.segment_replication.merge_latenccnode维度merge预拷贝延迟-avg使用物理复制功能时,每次node维度merge阶段结束后,数据拷贝到副本所消耗的平均值时间。
  • instanceId
  • ip
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.merge_latenccshard维度merge预拷贝延迟-avg使用物理复制功能时,每次shard维度merge阶段结束后,数据拷贝到副本所消耗的平均值时间。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.merge_latenccshard维度merge预拷贝延迟-max使用物理复制功能时,每次shard维度merge阶段结束后,数据拷贝到副本所消耗的最大值时间。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:max()
elasticsearch-server.segment_replication.replica_checkpoint_gap索引维度replica和复制位点的gap使用物理复制功能时,每次索引checkpoint阶段中复制位点的间隙数.
  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:max()
elasticsearch-server.segment_replication.replica_checkpoint_gapnode维度replica和复制位点的gap使用物理复制功能时,每次node checkpoint阶段中复制位点的间隙数。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:max()
elasticsearch-server.segment_replication.replica_checkpoint_gapshard维度replica和复制位点的gap使用物理复制功能时,每次shard checkpoint阶段中复制位点的间隙数。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:max()
elasticsearch-server.segment_replication.refresh_countshard维度增量拷贝QPS使用物理复制功能时,每次执行refresh操作进行增量数据拷贝的QPS。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.merge_error_countshard维度增量拷贝失败QPS使用物理复制功能,数据拷贝异常的QPS。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.merge_error_countshard维度merge预拷贝失败QPS使用物理复制功能,在merge阶段,数据拷贝异常的QPS。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.merge_countshard维度merge预拷贝QPSmerge合并次数。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.checkpoint_gap_countshard维度gap汇报的QPS使用物理复制功能,在checkpoint阶段的间隙数QPS。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:avg()
  • 采样聚合:avg()
elasticsearch-server.segment_replication.primary_checkpoint_gap.maxshard维度primary和复制位点的gap使用物理复制功能,在副本的checkpoint阶段间隙数大小。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()

isolator(隔离池)

指标指标含义说明Tags聚合算子
elasticsearch-server.isolator_tasks_isolated_total索引维度query isolated_total索引维度每秒慢查询隔离池中索引的查询数量。
  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.isolator_tasks_killed_total索引维度query cancel QPS索引维度每秒慢查询隔离池中索引触发熔断的查询数量。
  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.isolator_tasks_killed_mem_size_in_bytes.max索引维度query cancel mem_size_in_bytes max慢查询隔离池中索引触发熔断的查询消耗内存大小。
  • instanceId
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.isolator_tasks_isolated_totalnode维度query isolated_total每秒慢查询隔离池中节点的查询数量。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.isolator_tasks_killed_totalnode维度query cancel QPS每秒慢查询隔离池中节点触发熔断的查询数量。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.isolator_tasks_killed_mem_size_in_bytes.maxnode维度query cancel mem_size_in_bytes max慢查询隔离池中节点触发熔断的查询消耗内存大小。
  • instanceId
  • ip
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.isolator_tasks_isolated_totalshard维度query isolated_total每秒慢查询隔离池中索引shard的查询数量。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.isolator_tasks_killed_totalshard维度query cancel QPS每秒慢查询隔离池中索引shard触发熔断的查询数量。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()
elasticsearch-server.isolator_tasks_killed_mem_size_in_bytes.maxshard维度query cancel mem_size_in_bytes max慢查询隔离池中索引shard触发熔断的查询消耗内存大小。
  • instanceId
  • shard_id
  • ip
  • index
  • 指标聚合:max()
  • 采样聚合:avg()