应用监控与日志查询

您可通过监控与日志,了解检索增强型应用(8.17版)在指定时间段内的使用情况(例如,计算资源消耗、存储使用量、索引读写速率、应用请求及响应详情),也可查看对该应用的访问行为日志记录,快速发现慢查询、写入过载等潜在问题,及时优化资源配置,保障服务的稳定性。

前提条件

创建检索增强型应用(8.17版)

进入监控与日志

  1. 进入应用详情页。

    1. 登录Elasticsearch Serverless控制台,在顶部菜单栏切换至目标地域。

    2. 在左侧导航栏单击应用管理,单击已创建的应用名称,进入应用详情页。

  2. 在左侧导航栏的监控与日志页签,可通过查看监控中心访问日志,了解应用的使用情况。

查看监控中心

在监控中心页面,可查看应用的使用概况,以及指定时间段内应用的资源使用、索引使用、请求及响应等详细信息。ES Serverless为您提供了应用详情(新版)应用详情(旧版)查看界面,您可按需切换。

说明

新版相较于旧版,指标维度粒度更细,并且支持快速基于指标设置监控报警。

查看应用使用概况

在监控中心页面上方,可查看当前应用的计算资源及存储消耗情况,以及索引和文档的创建概况,以便全面监控应用的运行状态,合理配置资源并预防潜在风险。

image

指标名称

描述

查询计算资源

当天应用内的所有索引累计总共消耗的查询计算资源,以及日环比的增长或减少比例(即当天数据相较于前一天数据的增减情况)。

写入计算资源

当天应用内的所有索引累计总共消耗的写入计算资源,以及日环比的增长或减少比例(即当天数据相较于前一天数据的增减情况)。

总索引数

当前应用内创建的索引总数,以及当天相较前一天索引创建数量的增减情况。

存储用量

当前应用内的所有索引(不包含副本)累计总共消耗的存储量,以及当天相较前一天存储量消耗的增减情况。

总文档数

当前应用内的所有索引(不包含副本)累计总共创建的文档数量,以及当天相较前一天文档创建数量的增减情况。

查看应用使用详情(新版,推荐)

在监控中心页面,可按照下图步骤,查看目标类型指标(例如,应用维度的计量指标)在指定时间段内的使用详情及波动趋势,以便更细粒度的了解应用的使用状况。同时,还可按需执行如下操作:

  • 开启自动刷新:开启后,可按需指定刷新频率,系统将根据指定的间隔时间进行检测刷新,展示最新监控数据。

  • 设置报警并导出数据:单击image图标,可按照界面指引设置报警规则查看监控大盘导出实时监控数据

    说明

    您也可在指定监控指标的右上角,单击image图标,快速基于当前指标创建报警规则。

  • 切换新旧版界面:单击image图标,可切换至旧版应用使用详情界面。

image

说明

选择的查询时间段不同,指标的计算周期(即两点之间表示的时间间隔)不同;不同指标的计算方式(即采用周期内的平均值、最大值或求和值进行计算)存在差异,具体请以实际界面为准。

全量监控指标及相关描述如下表。

指标维度及资源类型

指标名称

描述

应用

端到端查询指标

应用请求QPS

当前应用每秒向Elasticsearch发送的请求次数,单位为次/s

应用请求响应时间

当前应用发送请求至Elasticsearch并收到响应所需的时间,单位为us(微秒)。

应用响应状态QPS

当前应用对于特定HTTP状态码(例如,表示请求成功的状态码200)的每秒请求次数,单位为次/s。您可通过不同状态码的QPS变化,快速定位问题类型、评估应用的性能及稳定性。

应用内指标

存储对应计量CU

因存储数据而消耗的CU,与存储容量相关。

应用存储用量

当前应用内所有索引(不包括副本)所消耗的存储总量。

应用总文档数

当前应用内所有索引(不包括副本)所创建的文档总数量,单位为条。

应用总索引数

当前应用内创建的索引总数,单位为条。

应用内所有索引分片查询QPS

当前应用内所有索引分片每秒处理的查询请求数量,单位为次/s

应用内所有索引写入QPS

当前应用内所有索引(包含副本)每秒处理的写入请求数量,单位为次/s

应用内写入带宽速率

应用内每秒写入的数据量带宽,单位为bit/s

计量指标

应用内每秒查询消耗CU

应用内每秒因执行搜索、聚合等查询操作所消耗的CU,用于反映查询负载情况。

应用内每秒写入消耗CU

应用内每秒因文档写入操作(例如,IndexUpdateDelete)所消耗的CU,用于反映写入负载情况。

应用内自动数据整理消耗CU

应用内因后台任务(例如,Segment mergeRefresh)自动运行所消耗的CU。

应用CU限额水位

当前CU使用量占应用配额的比例。取值为[0,1],若接近1,可能导致限流或拒绝请求。

配额/使用量

当前应用的固定CU配额及CU使用量。

索引

说明

按需选择目标索引,查看该索引的相关监控指标。

索引存储用量

单个索引(不包含副本)消耗的总存储用量。

索引总文档数

单个索引(不包含副本)创建的总文档数量,单位为条。

索引查询QPS

单个索引每秒处理的查询请求数量,单位为次/s

索引写入QPS

单个索引每秒处理的写入请求数量,单位为次/s

URI

URI请求QPS

每秒对于指定API接口的请求数量,单位为次/s。用于衡量目标接口在应用中的实时负载情况。

URI请求响应时间

对于指定API接口的请求响应时间。用于衡量接口性能,反映该接口的响应速度和延迟情况。

URI响应状态QPS

每秒对于指定API接口返回特定HTTP状态码(例如,表示请求成功的状态码200)的请求次数,单位为次/s。用于监控接口的成功率、错误类型及频率。

查看应用使用详情(旧版)

监控中心默认展示新版应用使用详情界面,您可单击image图标,切换至旧版界面。

查看资源使用详情

应用监控页签,可查看指定时间段内的资源消耗详情及波动趋势,以便通过分析资源使用规律和识别异常负载,来优化相关资源配置。

说明

默认查询精度为1分钟。选择的时间段不同,两点之间表示的时间间隔存在差异,具体请以实际界面为准。

image

指标名称

描述

查询计算资源

每个指标点表示在当前时间间隔内,查询操作平均每秒所消耗的CU量。

写入计算资源

每个指标点表示在当前时间间隔内,写入操作平均每秒所消耗的CU量。

存储所需最低计算资源

用于确保数据存储、访问和维护所需的最低CU量。

说明

为保障使用效率,系统会基于当前存储用量,动态调整存储所需的CU量。默认每CU能够支持的数据存储量最大为40GB,您也可通过max_storage_per_cu配置项,调整每CU对应的最大存储量

查询速率/查询QPS

当前应用内所有索引分片每秒处理的查询请求数量,单位为次/s

写入速率/写入QPS

当前应用内所有索引(包含副本)每秒处理的写入请求数量,单位为次/s

存储用量

当前应用内所有索引(不包括副本)所消耗的存储总量。

总索引数

当前应用内创建的索引总数。

总文档数

当前应用内所有索引(不包括副本)所创建的文档总数量,单位为条。

CU用量

某时刻读CU、写CU的消耗总量。

说明

蓝色线条表示固定CU量,绿色线条表示实际消耗的CU总量。

  • 无论是否开启弹性计算功能,当CU总量未超过固定CU量时,按照固定CU的计费标准收费。

  • 若开启弹性计算功能,当CU总量超过固定CU量时,未超出部分按照固定CU的计费标准收费,超出部分按照弹性CU的计费标准收费。

计费详情请参见费用说明

查看索引使用详情

索引监控页签,可查看指定时间段内各个索引的查询及写入速率、存储量消耗、创建的文档数量及其波动趋势,以便您实时掌握索引负载情况,及时发现突增的查询压力或异常写入行为,优化查询或写入性能。

说明
  • 默认查询精度为1分钟。选择的时间段不同,两点之间表示的时间间隔存在差异,具体请以实际界面为准。

  • 统计图中仅展示Top10的索引数据。您可在搜索框中输入指定索引查看详情,也可单击全量索引数据监控,查看全量索引的数据详情。

image

指标名称

描述

分片查询速率/查询QPS

单个索引每秒处理的查询请求数量,单位为次/s

写入文档数速率/QPS

单个索引每秒处理的写入请求数量,单位为次/s

单个索引总存储用量

单个索引(不包含副本)消耗的总存储用量。

单个索引的总文档数

单个索引(不包含副本)创建的总文档数量,单位为条。

查看请求及响应详情

请求监控页签,可查看应用的请求QPS、响应时间及响应状态信息,以便及时定位性能瓶颈、优化查询效率,确保服务安全可控。

说明
  • 默认查询精度为1分钟。选择的时间段不同,两点之间表示的时间间隔存在差异,具体请以实际界面为准。

  • 统计图中仅展示Top10URI数据。您可单击全量URI数据监控,查看全量URI的数据详情。

image

指标名称

描述

应用请求QPS

当前应用每秒向Elasticsearch发送的请求次数,单位为次/s

应用请求响应时间

当前应用发送请求至Elasticsearch并收到响应所需的时间,单位为us(微秒)。

应用响应状态QPS

当前应用对于特定HTTP状态码(例如,表示请求成功的状态码200)的每秒请求次数,单位为次/s。您可通过不同状态码的QPS变化,快速定位问题类型、评估应用的性能及稳定性。

URI请求QPS

每秒对于指定API接口的请求数量,单位为次/s。用于衡量目标接口在应用中的实时负载情况。

URI请求响应时间

对于指定API接口的请求响应时间。用于衡量接口性能,反映该接口的响应速度和延迟情况。

URI响应状态QPS

每秒对于指定API接口返回特定HTTP状态码(例如,表示请求成功的状态码200)的请求次数,单位为次/s。用于监控接口的成功率、错误类型及频率。

应用内各类Action请求QPS

每秒应用处理特定功能模块(例如,Action为用户登录、商品搜索等)的请求次数。用于衡量应用的并发处理能力及负载情况。

应用内各类Action请求响应时间

单个请求从客户端发起到服务器返回结果所需的平均时间。用于衡量应用的性能效率。

查看访问日志

访问日志记录了所有对ES Serverless应用的访问行为,可帮助您全面掌握系统的使用情况及潜在风险。您可在日志查询页面,查看指定时间段内的日志详情,也可通过request_idmethoduriaction_typestatus等参数搜索(例如,搜索返回状态为200的日志数据status: 200),查看符合条件的特定访问日志。

说明
  • 查询时间段为必配项,最多可查看近7天的日志数据。

  • 支持多条件组合查询,多个条件使用AND连接,并且返回的日志数据需同时满足所有查询条件。若未指定搜索条件,默认查看目标时间段内的所有日志。常见搜索场景及语句示例,请参见查询场景及语句示例

image

日志数据参数说明如下表。

参数

描述

示例

request_id

请求的唯一ID。用于定位日志,排查问题。

MOgVqpcBo8FIyo_j-XXX

method

HTTP的请求方法。例如,GETPOST

POST

uri

请求的URI路径(包含查询参数)。

/my_index/_search

action_type

ES Serverless支持的操作类型(例如,searchindexbulk)。

search

vpc_id

请求所在的专有网络标识。

vpc-12345XXX

remote_ip

客户端IP地址。

192.X.X.X

request_time

请求处理耗时,单位为微秒。

150

request_length

请求Body的字节长度。

2048

response_length

响应Body的字节长度。

2048

status

HTTP状态码(例如,200404)。

200

user_agent

客户端的User-Agent信息。

说明

User-Agent是客户端(例如,浏览器、应用程序、Kibana等)向ES Serverless应用发起HTTP请求时,自动附带的标识字段。用于描述发起请求的客户端的身份信息。

Kibana/8.17.0

time

请求结束的时间,即响应时间。

2025-06-26T02:34:16,149

查询场景及语句示例

示例场景

查询语句

查看所有慢请求(例如,请求时长大于1000微秒)

request_time > 1000

查看失败请求(即返回状态码为5xx

status >= 500

查看写入限流(即返回状态码为429

status: 429 AND method: POST

查看某个索引的搜索请求

uri:"/my_index/_search"

查看DELETE操作

method: DELETE

查看返回429状态码且处理时间超过1000微秒的POST请求。

method: POST AND status: 429 AND request_time > 1000

相关文档

为确保业务稳定运行,您可根据监控结果,按需调整相关服务配额,详情请参见调整配额