当您使用阿里云Elasticsearch时,系统会为您自动开通高级监控报警服务,并将您账号下的存量和新购Elasticsearch实例接入监控报警服务。本文为您介绍如何查看与配置可视化监控,以及如何配置日志报警规则和指标报警规则。
背景信息
高级监控报警服务能够为您所有地域下的Elasticsearch集群提供全维度指标和日志监控分析服务。您可以在平台为您提供的Grafana中查看集群、节点、索引和机器资源等维度的可视化监控数据,进行集群的异常日志分析,并可以根据业务需求自定义监控大屏和报警规则。关于高级监控报警的更多信息,请参见高级监控报警概述。
前提条件
- 已在支持高级监控报警服务的地域下创建阿里云Elasticsearch实例:
- 目前高级监控报警服务支持的地域包括:杭州、北京、上海、深圳、青岛、张家口、成都、广州、乌兰察布、美国东部、美国西部、日本、印度、印度尼西亚、中国香港,具体以控制台为准。
- 创建实例的具体操作,请参见创建阿里云Elasticsearch实例。
- 熟悉Grafana监控大屏的使用方法。详细信息,请参见Grafana Dashboard。
使用限制
- 高级监控报警功能提供了基础指标、引擎指标和日志数据的监控和报警。阿里云Elasticsearch所有版本都支持对实例的基础指标和日志数据监控,仅内核版本大于1.2.0的6.7.0或7.10.0版本支持引擎指标监控。如果内核版本低于1.2.0,可升级内核版本。具体操作,请参见升级版本。
- 高级监控报警服务存在地域限制,支持的地域仅包括:杭州、北京、上海、深圳、青岛、张家口、成都、广州、乌兰察布、美国东部、美国西部、日本、印度、印度尼西亚、中国香港,具体以控制台为准。
操作流程
操作视频
步骤一:查看和配置可视化监控
(可选)步骤二:配置日志报警规则
如果您需要通过监控日志进行报警通知,请执行以下操作:
(可选)步骤三:配置指标报警规则
如果您需要通过监控指标进行报警通知,请在高级监控报警页面的左侧导航栏中,执行以下操作:
常见问题
Q:同一时段内监控同一实例,为什么高级监控和Kibana监控的数据不一致?
A:阿里云Elasticsearch的高级监控是内部自研监控,在使用时会和其他监控服务的数据存在差异,具体如下:
- 采样周期差异性:采集周期和Kibana或第三方监控存在差异,采集到的数据不同,因此会存在差异。
- 查询算法差异性:例如,高级监控和Kibana监控采集数据时都会受集群稳定性的影响,高级监控QPS指标会因集群的抖动会出现监控突增、负值或无监控等状况,而Kibana监控可能显示为空。
说明 如果高级监控提供的指标比Kibana监控多,在实际使用时,建议将高级监控和Kibana监控结合起来分析集群监控详情。
- 采集接口差异性:Kibana监控指标依赖于Elasticsearch API,而高级监控部分节点级别的指标(例如CPU使用率、load_1m、磁盘使用率等),调用的是阿里云Elasticsearch底层系统接口,因此监控中除了Elasticsearch进程外还包含了系统级别资源的占用情况。