高级监控报警服务的指标监控功能提供基础指标和引擎指标等指标监控能力,方便您实时获取Elasticsearch集群侧和引擎侧指标数据,帮助您快速了解集群状况,更好地排查Elasticsearch集群引擎性能及稳定性问题。本文主要介绍如何通过指标监控功能获取监控数据。

前提条件

使用限制

  • 高级监控报警功能提供了基础指标、引擎指标和日志数据的监控和报警。阿里云Elasticsearch所有版本都支持对实例的基础指标和日志数据监控,仅内核版本大于1.2.0的6.7.0或7.10.0版本支持引擎指标监控。如果内核版本低于1.2.0,可升级内核版本。具体操作,请参见升级版本
  • 目前仅国内的杭州、北京、上海、深圳、青岛、张家口6个区域的实例支持接入高级监控报警服务。

操作步骤

  1. 登录阿里云Elasticsearch控制台
  2. 在左侧导航栏,单击高级监控报警
    说明 高级监控报警服务默认展示您账号下所有区域接入的实例数据,与您在控制台选择的可用区无关。例如,您在控制台选择北京区域,进入高级监控报警页面后,仍可以看到杭州区域接入的实例数据。
  3. 高级监控报警页面,选择监控可视化 > 指标监控,即可看到所有接入实例的指标监控数据。

    高级监控报警服务在指标维度提供基础指标和引擎指标监控,两者主要区别在于支持的监控对象不同,详情请参见下表。

    指标维度 说明
    基础指标 偏向粗粒度的资源监控,帮助您一站式获取集群整体资源状况,支持cluster、index、index Resource、Node Network、Node Disk、Node JVM和Thread_pool相关监控项。
    引擎指标 偏向细粒度的资源监控,帮助您快速获取多维度数据处理情况,支持search、bulk(shard)、时序写入Serverless、cache、refresh、merge、cluster state、segment replication和isolator相关监控项。
    说明
    • 高级监控报警服务中的Grafana监控大盘,使用方式与开源Grafana一致。更多信息,请参见Grafana documentation
    • 高级监控报警服务提供的所有默认监控大盘,均不支持任何修改。如需修改,您可通过自定义监控定制更贴合业务需求的监控大盘。
    • 如果您需要获取更详细的指标监控项说明,请参见基础指标引擎指标
  4. 查看指定实例、节点或索引等的监控数据。
    1. 鼠标停留在监控窗口,按键盘Esc键,将跳出Grafana菜单页及过滤栏。
    2. 在过滤栏中,根据需求输入指定的相关信息,即可查看所需的监控数据。参数详细说明,请参见下表。
      模块 标签 说明
      过滤栏 source 指标监控数据源,默认值为es-metric
      说明 下拉列表中的default源数据和es-metric源数据一致。
      instanceId 通过实例ID过滤监控数据,默认*,表示无实例限制,将展示所有实例监控。
      IP 通过集群节点IP过滤监控数据,默认*,表示无IP限制,将展示实例下所有节点。
      index 通过索引名过滤监控数据,默认*,表示无索引限制,将显示所有索引监控。
      shardId 通过shardId过滤监控数据,默认*,表示无shardId限制,将显示所有shard监控。
      regionId 通过区域过滤监控数据,默认ALL,表示无地域限制,将显示所有区域下开启高级监控报警功能的实例监控。
      过滤栏