高级监控报警服务的指标监控功能提供基础指标和引擎指标等指标监控能力,方便您实时获取Elasticsearch集群侧和引擎侧指标数据,帮助您快速了解集群状况,更好地排查Elasticsearch集群引擎性能及稳定性问题。本文主要介绍如何通过指标监控功能获取监控数据。
前提条件
已在支持高级监控报警服务的地域下创建阿里云Elasticsearch实例:
目前高级监控报警服务支持的地域包括:杭州、北京、上海、深圳、青岛、张家口、成都、广州、乌兰察布、北京金融云、美国东部、美国西部、日本、印度尼西亚、中国香港,具体以控制台为准。
创建实例的具体操作,请参见创建阿里云Elasticsearch实例。
熟悉Grafana监控大屏的使用方法。详细信息,请参见Grafana Dashboard。
使用限制
高级监控报警功能提供了基础指标、引擎指标和日志数据的监控和报警。仅内核版本大于1.2.0的6.7.0或7.10.0版本支持引擎指标监控。升级内核版本,请参见升级版本。
使用RAM角色单点登录阿里云控制台时,不支持访问高级监控报警服务。如果需要访问,可使用RAM用户单点登录阿里云控制台。
操作步骤
- 登录阿里云Elasticsearch控制台。
在左侧导航栏,单击高级监控报警。
说明高级监控报警服务默认展示您账号下所有地域接入的实例数据。
在高级监控报警页面,选择 ,即可看到所有接入实例的指标监控数据。
高级监控报警服务在指标维度提供基础指标和引擎指标监控,两者主要区别在于支持的监控对象不同,详情请参见下表。
指标维度
说明
基础指标
偏向粗粒度的资源监控,帮助您一站式获取集群整体资源状况,支持cluster、index、Node Resource、Node Network、Node Disk、Node JVM和Thread_pool相关监控项。
说明海外地域7.10版本以下的实例,支持的基础指标不同,不支持的指标无数据,具体以控制台为准。
引擎指标
偏向细粒度的资源监控,帮助您快速获取多维度数据处理情况,支持search、bulk、Indexing Service、Openstore、cache、refresh、merge、cluster state、segment replication和isolator相关监控项。
说明- 高级监控报警服务中的Grafana监控大盘,使用方式与开源Grafana一致。更多信息,请参见Grafana documentation。
- 高级监控报警服务提供的所有默认监控大盘,均不支持任何修改。如需修改,您可通过配置自定义监控大屏定制更贴合业务需求的监控大盘。
查看指定实例、节点或索引等的监控数据。
鼠标停留在监控窗口,按键盘Esc键,将跳出Grafana菜单页及过滤栏。
在过滤栏中,根据需求输入或选择对应信息,查看监控数据。
过滤项
说明
source/datasource
指标监控数据源,默认值为es-metric。
说明下拉列表中的default源数据和es-metric源数据一致。
instanceId
通过实例ID过滤监控数据,默认*,表示无实例限制,即查看所有实例的监控数据。
ip/node_ip
通过集群节点IP过滤监控数据,默认*,表示无IP限制,即查看实例下所有节点的监控数据。
index
通过索引名过滤监控数据,默认*,表示无索引限制,即查看所有索引的监控数据。
shardId
通过shardId过滤监控数据,默认*,表示无shardId限制,即查看所有shard的监控数据。
regionId
通过地域过滤监控数据,默认ALL,表示无地域限制,即查看所有地域下的实例的监控数据。