ElasticSearch接入

更新时间:
复制 MD 格式

可观测监控 Prometheus 版可通过配置接入参数主动拉取ElasticSearch的性能指标,实现对其运行状况的实时监控和数据分析。

前提条件

容器服务环境

ECS(VPC)

接入ElasticSearch

  1. 登录Prometheus控制台,在左侧导航栏单击接入中心

  2. 单击ElasticSearch卡片,然后根据控制台指引完成组件接入。下面对重点配置项进行说明。

    容器服务环境

    配置项

    说明

    ElasticSearch 服务域名

    支持以下三类ElasticSearch服务域名:

    • ElasticSearch的集群内访问地址(例如:elasticsearch-server.namespace)

    • 服务所处集群内网IP地址

    • 服务所处公网的IPv4地址

    ElasticSearch 服务端口

    ElasticSearch的端口号,例如:9200。

    ElasticSearch 登录用户名

    ElasticSearch的登录用户名。

    ElasticSearch 登录密码

    ElasticSearch的登录密码。

    Metric 采集间隔(单位/秒)

    监控数据采集时间间隔,默认15s。

    ECS(VPC)

    配置项

    说明

    ElasticSearch 服务域名

    支持以下三类ElasticSearch服务域名:

    • ElasticSearch的集群内访问地址(例如:elasticsearch-server.namespace)

    • 服务所处集群内网IP地址

    • 服务所处公网的IPv4地址

    ElasticSearch 服务端口

    ElasticSearch的端口号,例如9200。

    ElasticSearch 登录用户名

    ElasticSearch的登录用户名。

    ElasticSearch 登录密码

    ElasticSearch的登录密码。

    Metric 采集间隔(单位/秒)

    监控数据采集时间间隔,默认15s。

    自定义标签

    通过自定义标签向Prometheus收集的指标中添加自定义键值对标签,便于在使用Grafana等工具时对这些指标进行细粒度的组织、查询、监控和分析。更多信息,请参见VPC环境主机监控自定义标签注入指标

    说明
    • 标签名不能包含特殊字符,如短划线(-)、半角句号(.)、百分号(%)等,这些字符在Prometheus中有特殊含义。

    • 注入的标签需要是Prometheus允许的有效的Key-Value标签格式。

查看ElasticSearch状态

已接入的组件可单击Prometheus控制台左侧导航栏中的接入管理查看。接入管理页面包括已接入环境已接入组件大盘查询页签,您可以查看Targets、指标、大盘、告警等信息。

Targets

您可以在该页签查看集成默认Job发现的Targets列表。

该页面提供AllUnhealthy两个筛选Tab,列表中每个Target条目显示实例名称及健康状态,格式为(x/x up)。红色状态如(0/1 up)表示不健康,黑色状态如(1/1 up)表示健康。

指标采集

您可以在该页签查看具体的指标信息并对指标进行废弃配置。具体操作,请参见配置废弃指标

指标采集页签左侧导航中选择自定义采集,可查看已创建的自定义采集任务列表。列表包含名称job名称所属组件服务发现方式采集路径采集间隔操作列。单击右上角新增可添加自定义采集任务,每个任务支持关闭查看配置删除操作。

大盘

您可以单击大盘名称,查看对应Grafana大盘。Grafana 的 ElasticSearch Overview 仪表盘页面顶部提供 IntervalClusterNode nameSource of metrics 等筛选条件。KPI 区域展示 Cluster healthCPU usage Avg.JVM memory used Avg.NodesData nodesPending tasks 等指标,Shards 区域展示 Active primary shardsActive shardsInitializing shardsRelocating shardsDelayed shardsUnassigned shards 等分片指标。当所有指标均显示为 N/A 或无数据时,表明监控数据未被采集到。页面下方包含 JVM Garbage CollectionTranslogBreakersCPU and MemoryDisk and NetworkDocumentsThread PoolCachesSegments 等可折叠的详细监控面板。

告警规则

您可以在该页签查看Prometheus告警。如果您需要创建Prometheus告警规则,请参见创建Prometheus告警规则。Elasticsearch ECS 集群默认包含以下5条告警规则:ElasticsearchProcessNotRunningSystemCPUHighElasticsearchClusterNotHealthyElasticsearchPoolJVMHighElasticsearchTooFewNodesRunning,告警分组均为 elasticsearch-ECS-Common,等级为默认,状态均为运行中。每条规则支持编辑停止复制查看告警事件操作。

相关文档

组件接入后,您可以对关键指标配置告警规则,实时监控指标的性能健康状态,以便在指标异常状态时能及时发现并处理。具体操作,请参见创建Prometheus告警规则