MSE 网关高级监控指标接入

更新时间:
复制为 MD 格式

本文介绍如何将 MSE 云原生网关的高级监控指标接入到云监控 2.0。接入后,系统会自动采集网关核心运行指标(如请求延迟、上游服务健康度、连接数等),结合预置的多维度监控看板,帮助您快速定位网关性能瓶颈和异常。

前提条件

使用限制

  • 仅适用于 MSE 云原生网关实例,不适用于 MSE 注册配置中心(Nacos/ZooKeeper)。

费用说明

  • 接入 MSE 网关高级监控指标将按照 Prometheus 的计费规则计费。

数据接入

  1. 登录云监控 2.0 控制台,选择目标工作空间后,在左侧导航栏单击接入中心,搜索并单击 MSE 网关高级监控指标开始接入。

  2. 选择需要接入的 MSE 网关实例组。系统会自动发现当前账号下的 MSE 云原生网关实体组,接入后将对组内所有网关实例生效。

  3. 在接入配置区域配置以下信息:

    配置项

    说明

    自定义采集指标

    非必填,指定需要采集的指标名称,支持配置多个指标名,使用竖线分隔。不填写则使用系统默认采集指标

  4. 单击确定,接入后可在接入管理中查看已接入的实例组,并通过预置的监控看板查看网关运行状况。

卸载或修改接入策略

如果期望修改 MSE 网关高级监控指标的接入配置,可以在接入中心的接入管理页,找到对应的接入策略,进行编辑或删除操作。

默认采集指标

系统默认采集以下 47 个核心指标,未自定义时将自动使用此列表。

容器资源指标

指标名

说明

container_memory_working_set_bytes

容器当前使用的内存大小

kube_pod_container_resource_limits_memory_bytes

容器内存限制

container_cpu_usage_seconds_total

容器累计使用的 CPU 时间

kube_pod_container_resource_limits_cpu_cores

容器 CPU 核心数限制

kube_pod_container_resource_requests_cpu_cores

容器 CPU 核心数请求

kube_pod_status_phase

Pod 运行状态

container_network_receive_bytes_total

容器网络接收数据总量

container_network_transmit_bytes_total

容器网络发送数据总量

container_fs_writes_bytes_total

容器文件系统写入字节总数

container_fs_reads_bytes_total

容器文件系统读取字节总数

HTTP 下游请求指标

指标名

说明

envoy_http_downstream_rq_total

下游 HTTP 请求总数

envoy_http_downstream_rq

下游 HTTP 请求数量(按状态码分类)

envoy_http_downstream_rq_time_bucket

下游 HTTP 请求时间分布

envoy_http_downstream_rq_time_sum

下游 HTTP 请求时间总和

envoy_http_downstream_rq_time_count

下游 HTTP 请求次数

envoy_http_downstream_cx_active

当前活跃的下游连接数

envoy_http_downstream_cx_rx_bytes_total

下游接收字节数

envoy_http_downstream_cx_tx_bytes_total

下游发送字节数

压缩指标

指标名

说明

envoy_http_compressor_text_optimized_gzip_compressed

Gzip 压缩数量

envoy_http_compressor_text_optimized_gzip_not_compressed

Gzip 未压缩数量

envoy_http_compressor_text_optimized_gzip_total_compressed_bytes

压缩后字节总数

envoy_http_compressor_text_optimized_gzip_total_uncompressed_bytes

压缩前字节总数

外部授权指标

指标名

说明

envoy_http_ext_authz_ok

外部授权通过数

envoy_http_ext_authz_denied

外部授权拒绝数

envoy_http_ext_authz_disabled

外部授权禁用数

envoy_http_ext_authz_timeout

外部授权超时数

集群上游请求指标

指标名

说明

envoy_cluster_upstream_rq_total

集群上游请求总数

envoy_cluster_upstream_rq

集群上游请求数量(按状态码分类)

envoy_cluster_upstream_rq_time_bucket

集群上游请求处理时间分布

envoy_cluster_upstream_rq_time_sum

集群上游请求处理时间总和

envoy_cluster_upstream_rq_time_count

集群上游请求次数

envoy_cluster_upstream_rq_timeout

集群上游请求超时数

envoy_cluster_upstream_cx_total

集群上游连接总数

envoy_cluster_upstream_cx_active

集群当前活跃的上游连接数

envoy_cluster_upstream_cx_destroy

集群销毁的上游连接数

envoy_cluster_membership_healthy

集群中健康的成员数量

监听器指标

指标名

说明

envoy_listener_downstream_cx_total

监听器下游连接总数

envoy_listener_downstream_cx_destroy

监听器销毁的下游连接数

envoy_listener_ssl_handshake

SSL 握手完成数

envoy_listener_ssl_session_reused

SSL 会话复用数

envoy_listener_ssl_connection_error

SSL 连接错误数

限流指标

指标名

说明

envoy_sentinel_rate_limiter_http_sentinel_rate_limit_new_rate_limited

限流触发数

虚拟主机路由指标

指标名

说明

envoy_vhost_route_upstream_rq

虚拟主机路由请求数量

envoy_vhost_route_upstream_rq_timeout

虚拟主机路由请求超时数

envoy_vhost_route_upstream_rq_total

虚拟主机路由请求总数

AI 模型令牌指标

指标名

说明

route_upstream_model_metric_input_token

路由模型输入令牌数量

route_upstream_model_metric_output_token

路由模型输出令牌数量

全量指标列表

以下是系统支持的全量指标列表(共 49 个),您可以通过自定义采集指标功能选择性采集。

指标名

类型

说明

container_memory_working_set_bytes

GAUGE

容器当前使用的内存大小

kube_pod_container_resource_limits_memory_bytes

GAUGE

容器内存限制

container_cpu_usage_seconds_total

COUNTER

容器累计使用的 CPU 时间

kube_pod_container_resource_limits_cpu_cores

GAUGE

容器 CPU 核心数限制

container_network_receive_bytes_total

COUNTER

容器网络接收数据总量

container_network_transmit_bytes_total

COUNTER

容器网络发送数据总量

container_fs_writes_bytes_total

COUNTER

容器文件系统写入字节总数

container_fs_reads_bytes_total

COUNTER

容器文件系统读取字节总数

envoy_http_downstream_rq_total

COUNTER

下游 HTTP 请求总数

envoy_http_downstream_rq_time_sum

HISTOGRAM

下游 HTTP 请求时间总和

envoy_http_downstream_rq_time_count

COUNTER

下游 HTTP 请求次数

envoy_http_downstream_cx_rx_bytes_total

COUNTER

下游接收字节数

envoy_http_downstream_cx_tx_bytes_total

COUNTER

下游发送字节数

envoy_http_downstream_rq

COUNTER

下游 HTTP 请求数量(按状态码分类)

envoy_http_downstream_rq_time_bucket

HISTOGRAM

下游 HTTP 请求时间分布

envoy_http_downstream_cx_active

GAUGE

当前活跃的下游连接数

envoy_listener_downstream_cx_total

COUNTER

监听器下游连接总数

envoy_listener_downstream_cx_destroy

COUNTER

监听器销毁的下游连接数

envoy_listener_ssl_handshake

COUNTER

SSL 握手完成数

envoy_listener_ssl_session_reused

COUNTER

SSL 会话复用数

envoy_listener_ssl_connection_error

COUNTER

SSL 连接错误数

envoy_sentinel_rate_limiter_http_sentinel_rate_limit_new_rate_limited

COUNTER

限流触发数

envoy_cluster_upstream_rq_total

COUNTER

集群上游请求总数

envoy_cluster_upstream_rq

COUNTER

集群上游请求数量(按状态码分类)

envoy_cluster_upstream_rq_time_sum

HISTOGRAM

集群上游请求处理时间总和

envoy_cluster_upstream_rq_time_count

COUNTER

集群上游请求次数

envoy_cluster_upstream_rq_time_bucket

HISTOGRAM

集群上游请求处理时间分布

envoy_cluster_upstream_rq_retry

COUNTER

集群上游请求重试次数

envoy_cluster_upstream_cx_total

COUNTER

集群上游连接总数

envoy_cluster_upstream_cx_active

GAUGE

集群当前活跃的上游连接数

envoy_cluster_upstream_cx_destroy

COUNTER

集群销毁的上游连接数

envoy_cluster_membership_healthy

GAUGE

集群中健康的成员数量

envoy_cluster_upstream_cx_connect_fail

COUNTER

集群上游连接失败次数

envoy_cluster_upstream_cx_connect_ms_bucket

HISTOGRAM

集群上游连接建立时间分布

envoy_cluster_upstream_cx_connect_ms_count

COUNTER

集群上游连接建立次数

envoy_cluster_upstream_cx_connect_ms_sum

HISTOGRAM

集群上游连接建立时间总和

envoy_cluster_upstream_cx_destroy_local

COUNTER

本地端发起关闭的上游连接数

envoy_cluster_upstream_cx_destroy_remote

COUNTER

远程端发起关闭的上游连接数

envoy_cluster_upstream_cx_rx_bytes_total

COUNTER

集群上游接收字节数

envoy_cluster_upstream_cx_tx_bytes_total

COUNTER

集群上游发送字节数

route_upstream_model_metric_input_token

COUNTER

路由模型输入令牌数量

route_upstream_model_metric_output_token

COUNTER

路由模型输出令牌数量

envoy_vhost_route_upstream_rq

COUNTER

虚拟主机路由请求数量

envoy_vhost_route_upstream_rq_timeout

COUNTER

虚拟主机路由请求超时数

envoy_vhost_route_upstream_rq_total

COUNTER

虚拟主机路由请求总数

envoy_vhost_route_upstream_rq_time_bucket

HISTOGRAM

虚拟主机路由请求处理时间分布

envoy_vhost_route_upstream_rq_time_sum

HISTOGRAM

虚拟主机路由请求处理时间总和

envoy_vhost_route_upstream_rq_time_count

COUNTER

虚拟主机路由请求次数

envoy_server_live

GAUGE

Envoy 服务器存活状态