本文介绍如何将 MSE 云原生网关的高级监控指标接入到云监控 2.0。接入后,系统会自动采集网关核心运行指标(如请求延迟、上游服务健康度、连接数等),结合预置的多维度监控看板,帮助您快速定位网关性能瓶颈和异常。
前提条件
已开通微服务引擎 MSE云原生网关。
已开通 Prometheus 监控服务。
若使用 RAM 用户接入,需要授予
AliyunCloudMonitorFullAccess系统策略。
使用限制
仅适用于 MSE 云原生网关实例,不适用于 MSE 注册配置中心(Nacos/ZooKeeper)。
费用说明
接入 MSE 网关高级监控指标将按照 Prometheus 的计费规则计费。
数据接入
登录云监控 2.0 控制台,选择目标工作空间后,在左侧导航栏单击接入中心,搜索并单击 MSE 网关高级监控指标开始接入。
选择需要接入的 MSE 网关实例组。系统会自动发现当前账号下的 MSE 云原生网关实体组,接入后将对组内所有网关实例生效。
在接入配置区域配置以下信息:
配置项
说明
自定义采集指标
非必填,指定需要采集的指标名称,支持配置多个指标名,使用竖线分隔。不填写则使用系统默认采集指标。
单击确定,接入后可在接入管理中查看已接入的实例组,并通过预置的监控看板查看网关运行状况。
卸载或修改接入策略
如果期望修改 MSE 网关高级监控指标的接入配置,可以在接入中心的接入管理页,找到对应的接入策略,进行编辑或删除操作。
默认采集指标
系统默认采集以下 47 个核心指标,未自定义时将自动使用此列表。
容器资源指标
指标名 | 说明 |
container_memory_working_set_bytes | 容器当前使用的内存大小 |
kube_pod_container_resource_limits_memory_bytes | 容器内存限制 |
container_cpu_usage_seconds_total | 容器累计使用的 CPU 时间 |
kube_pod_container_resource_limits_cpu_cores | 容器 CPU 核心数限制 |
kube_pod_container_resource_requests_cpu_cores | 容器 CPU 核心数请求 |
kube_pod_status_phase | Pod 运行状态 |
container_network_receive_bytes_total | 容器网络接收数据总量 |
container_network_transmit_bytes_total | 容器网络发送数据总量 |
container_fs_writes_bytes_total | 容器文件系统写入字节总数 |
container_fs_reads_bytes_total | 容器文件系统读取字节总数 |
HTTP 下游请求指标
指标名 | 说明 |
envoy_http_downstream_rq_total | 下游 HTTP 请求总数 |
envoy_http_downstream_rq | 下游 HTTP 请求数量(按状态码分类) |
envoy_http_downstream_rq_time_bucket | 下游 HTTP 请求时间分布 |
envoy_http_downstream_rq_time_sum | 下游 HTTP 请求时间总和 |
envoy_http_downstream_rq_time_count | 下游 HTTP 请求次数 |
envoy_http_downstream_cx_active | 当前活跃的下游连接数 |
envoy_http_downstream_cx_rx_bytes_total | 下游接收字节数 |
envoy_http_downstream_cx_tx_bytes_total | 下游发送字节数 |
压缩指标
指标名 | 说明 |
envoy_http_compressor_text_optimized_gzip_compressed | Gzip 压缩数量 |
envoy_http_compressor_text_optimized_gzip_not_compressed | Gzip 未压缩数量 |
envoy_http_compressor_text_optimized_gzip_total_compressed_bytes | 压缩后字节总数 |
envoy_http_compressor_text_optimized_gzip_total_uncompressed_bytes | 压缩前字节总数 |
外部授权指标
指标名 | 说明 |
envoy_http_ext_authz_ok | 外部授权通过数 |
envoy_http_ext_authz_denied | 外部授权拒绝数 |
envoy_http_ext_authz_disabled | 外部授权禁用数 |
envoy_http_ext_authz_timeout | 外部授权超时数 |
集群上游请求指标
指标名 | 说明 |
envoy_cluster_upstream_rq_total | 集群上游请求总数 |
envoy_cluster_upstream_rq | 集群上游请求数量(按状态码分类) |
envoy_cluster_upstream_rq_time_bucket | 集群上游请求处理时间分布 |
envoy_cluster_upstream_rq_time_sum | 集群上游请求处理时间总和 |
envoy_cluster_upstream_rq_time_count | 集群上游请求次数 |
envoy_cluster_upstream_rq_timeout | 集群上游请求超时数 |
envoy_cluster_upstream_cx_total | 集群上游连接总数 |
envoy_cluster_upstream_cx_active | 集群当前活跃的上游连接数 |
envoy_cluster_upstream_cx_destroy | 集群销毁的上游连接数 |
envoy_cluster_membership_healthy | 集群中健康的成员数量 |
监听器指标
指标名 | 说明 |
envoy_listener_downstream_cx_total | 监听器下游连接总数 |
envoy_listener_downstream_cx_destroy | 监听器销毁的下游连接数 |
envoy_listener_ssl_handshake | SSL 握手完成数 |
envoy_listener_ssl_session_reused | SSL 会话复用数 |
envoy_listener_ssl_connection_error | SSL 连接错误数 |
限流指标
指标名 | 说明 |
envoy_sentinel_rate_limiter_http_sentinel_rate_limit_new_rate_limited | 限流触发数 |
虚拟主机路由指标
指标名 | 说明 |
envoy_vhost_route_upstream_rq | 虚拟主机路由请求数量 |
envoy_vhost_route_upstream_rq_timeout | 虚拟主机路由请求超时数 |
envoy_vhost_route_upstream_rq_total | 虚拟主机路由请求总数 |
AI 模型令牌指标
指标名 | 说明 |
route_upstream_model_metric_input_token | 路由模型输入令牌数量 |
route_upstream_model_metric_output_token | 路由模型输出令牌数量 |
全量指标列表
以下是系统支持的全量指标列表(共 49 个),您可以通过自定义采集指标功能选择性采集。
指标名 | 类型 | 说明 |
container_memory_working_set_bytes | GAUGE | 容器当前使用的内存大小 |
kube_pod_container_resource_limits_memory_bytes | GAUGE | 容器内存限制 |
container_cpu_usage_seconds_total | COUNTER | 容器累计使用的 CPU 时间 |
kube_pod_container_resource_limits_cpu_cores | GAUGE | 容器 CPU 核心数限制 |
container_network_receive_bytes_total | COUNTER | 容器网络接收数据总量 |
container_network_transmit_bytes_total | COUNTER | 容器网络发送数据总量 |
container_fs_writes_bytes_total | COUNTER | 容器文件系统写入字节总数 |
container_fs_reads_bytes_total | COUNTER | 容器文件系统读取字节总数 |
envoy_http_downstream_rq_total | COUNTER | 下游 HTTP 请求总数 |
envoy_http_downstream_rq_time_sum | HISTOGRAM | 下游 HTTP 请求时间总和 |
envoy_http_downstream_rq_time_count | COUNTER | 下游 HTTP 请求次数 |
envoy_http_downstream_cx_rx_bytes_total | COUNTER | 下游接收字节数 |
envoy_http_downstream_cx_tx_bytes_total | COUNTER | 下游发送字节数 |
envoy_http_downstream_rq | COUNTER | 下游 HTTP 请求数量(按状态码分类) |
envoy_http_downstream_rq_time_bucket | HISTOGRAM | 下游 HTTP 请求时间分布 |
envoy_http_downstream_cx_active | GAUGE | 当前活跃的下游连接数 |
envoy_listener_downstream_cx_total | COUNTER | 监听器下游连接总数 |
envoy_listener_downstream_cx_destroy | COUNTER | 监听器销毁的下游连接数 |
envoy_listener_ssl_handshake | COUNTER | SSL 握手完成数 |
envoy_listener_ssl_session_reused | COUNTER | SSL 会话复用数 |
envoy_listener_ssl_connection_error | COUNTER | SSL 连接错误数 |
envoy_sentinel_rate_limiter_http_sentinel_rate_limit_new_rate_limited | COUNTER | 限流触发数 |
envoy_cluster_upstream_rq_total | COUNTER | 集群上游请求总数 |
envoy_cluster_upstream_rq | COUNTER | 集群上游请求数量(按状态码分类) |
envoy_cluster_upstream_rq_time_sum | HISTOGRAM | 集群上游请求处理时间总和 |
envoy_cluster_upstream_rq_time_count | COUNTER | 集群上游请求次数 |
envoy_cluster_upstream_rq_time_bucket | HISTOGRAM | 集群上游请求处理时间分布 |
envoy_cluster_upstream_rq_retry | COUNTER | 集群上游请求重试次数 |
envoy_cluster_upstream_cx_total | COUNTER | 集群上游连接总数 |
envoy_cluster_upstream_cx_active | GAUGE | 集群当前活跃的上游连接数 |
envoy_cluster_upstream_cx_destroy | COUNTER | 集群销毁的上游连接数 |
envoy_cluster_membership_healthy | GAUGE | 集群中健康的成员数量 |
envoy_cluster_upstream_cx_connect_fail | COUNTER | 集群上游连接失败次数 |
envoy_cluster_upstream_cx_connect_ms_bucket | HISTOGRAM | 集群上游连接建立时间分布 |
envoy_cluster_upstream_cx_connect_ms_count | COUNTER | 集群上游连接建立次数 |
envoy_cluster_upstream_cx_connect_ms_sum | HISTOGRAM | 集群上游连接建立时间总和 |
envoy_cluster_upstream_cx_destroy_local | COUNTER | 本地端发起关闭的上游连接数 |
envoy_cluster_upstream_cx_destroy_remote | COUNTER | 远程端发起关闭的上游连接数 |
envoy_cluster_upstream_cx_rx_bytes_total | COUNTER | 集群上游接收字节数 |
envoy_cluster_upstream_cx_tx_bytes_total | COUNTER | 集群上游发送字节数 |
route_upstream_model_metric_input_token | COUNTER | 路由模型输入令牌数量 |
route_upstream_model_metric_output_token | COUNTER | 路由模型输出令牌数量 |
envoy_vhost_route_upstream_rq | COUNTER | 虚拟主机路由请求数量 |
envoy_vhost_route_upstream_rq_timeout | COUNTER | 虚拟主机路由请求超时数 |
envoy_vhost_route_upstream_rq_total | COUNTER | 虚拟主机路由请求总数 |
envoy_vhost_route_upstream_rq_time_bucket | HISTOGRAM | 虚拟主机路由请求处理时间分布 |
envoy_vhost_route_upstream_rq_time_sum | HISTOGRAM | 虚拟主机路由请求处理时间总和 |
envoy_vhost_route_upstream_rq_time_count | COUNTER | 虚拟主机路由请求次数 |
envoy_server_live | GAUGE | Envoy 服务器存活状态 |