高级监控报警的日志监控功能提供了慢查询日志、慢索引日志、访问日志和主日志等日志监控能力,方便您实时获取集群日志情况,从运维角度,能够帮助您快速排查和定位问题。本文主要介绍如何通过日志监控功能获取监控数据以及如何快速过滤日志数据。
前提条件
- 已在支持高级监控报警服务的地域下创建阿里云Elasticsearch实例:
- 目前高级监控报警服务支持的地域包括:杭州、北京、上海、深圳、青岛、张家口、成都、广州、乌兰察布、美国东部、美国西部、日本、印度、印度尼西亚、中国香港,具体以控制台为准。
- 创建实例的具体操作,请参见创建阿里云Elasticsearch实例。
- 熟悉Grafana监控大屏的使用方法。详细信息,请参见Grafana Dashboard。
使用限制
- 高级监控报警功能提供了基础指标、引擎指标和日志数据的监控和报警。阿里云Elasticsearch所有版本都支持对实例的基础指标和日志数据监控,仅内核版本大于1.2.0的6.7.0或7.10.0版本支持引擎指标监控。如果内核版本低于1.2.0,可升级内核版本。具体操作,请参见升级版本。
- 高级监控报警服务存在地域限制,支持的地域仅包括:杭州、北京、上海、深圳、青岛、张家口、成都、广州、乌兰察布、美国东部、美国西部、日本、印度、印度尼西亚、中国香港,具体以控制台为准。
查看默认日志指标
查询日志
日志监控支持对慢查询日志、慢索引日志、访问日志和主日志进行过滤查询,不同的日志类型来自不同的数据源。具体信息见下表。
数据源 | 说明 |
---|---|
es-slow-search | 提供慢查询日志数据。 |
es-slow-index | 提供慢索引日志数据。 |
es-access-log | 提供访问日志数据(当前仅支持6.7.0和7.10.0版本的实例)。 |
es-instance-search | 提供主日志数据。 |
由于各类日志的查询流程一致,所以本文以慢查询日志为例,介绍日志查询的操作步骤。
日志查询内置字段列表
- 独立字段
类型 独立字段 说明 慢查询 search_time_ms 查询耗时时长。 search_total_hits 查询命中的文档数。 search_type 查询类型。 shard_id 执行该条查询的shard编号。 slow_search_log_type 慢日志类型。 total_shards 总shard数。 content query查询体。 慢写入 index_time_ms 写入耗时时长。 content query查询体。 主日志 content query查询体。 访问日志 node 产生访问日志的Elasticsearch节点。 query 执行的查询体,过滤时请使用source代替query字段做查询。 remote 远程服务器IP地址。 bodySize 请求大小。单位:Byte。 uri 访问路径。 说明 独立字段仅说明各个日志类型支持的不同的字段部分,相同字段部分请参考下表通用字段。 - 通用字段
通过字段 说明 es_available_zone 实例可用区。 es_region 实例所在地域。 es_resourceUid 实例UID。 es_resource_group 实例所在资源组。 host 节点IP。 instanceId 实例ID。 level 日志级别,包括trace、debug、info、warn、error等。 说明 以_
开头的字段均为Elasticsearch元数据自带的字段。