为集群控制面组件启用链路追踪

更新时间:2025-03-19 02:04:56

为了快速定位性能瓶颈、排查集群问题,建议为集群API Server启用链路追踪,记录其请求交互细节。启用后,API Server的链路信息将自动上报至可观测链路 OpenTelemetry 版,提供可视化的链路明细、实时拓扑等监控数据。

如果您不熟悉链路追踪,可参见基本概念了解相关基础概念。

前提条件

说明

使用本功能时,除ACK集群产生的费用外,还会产生可观测数据量计费,由可观测链路 OpenTelemetry 版收取。关于可观测链路 OpenTelemetry 版提供的免费额度和具体定价,请参见计费说明


您可以配置API Server参数,开启链路追踪并配置链路追踪的采样率。配置后,可观测链路 OpenTelemetry 版控制台将展示详细的调用链路数据。

步骤一:API Server开启链路追踪

  1. 登录容器服务管理控制台,在左侧导航栏选择集群列表

  2. 集群列表页面,单击目标集群名称,然后在左侧导航栏,选择运维管理 > 组件管理

  3. 核心组件区域,单击Kube API Server卡片右下方的配置

  4. 在配置面板,定位enableTracesamplingRatePerMillion参数,按照页面提示完成配置。

    image

    • enableTrace:为API Server开启链路追踪功能。

    • samplingRatePerMillion:控制采样率,决定每一百万次请求中被采样的比例。您可以根据集群的负载情况配置采样率。

      例如,1000000表示100%的采样率,即每一百万次请求中,所有请求都会被采样和记录;100000表示10%的采样率;10000表示1%的采样率。

步骤二:在OpenTelemetry中查看调用链路数据

  1. 登录可观测链路 OpenTelemetry 版控制台,在左侧导航栏单击应用列表

  2. 在页面顶部选择地域,然后单击应用名称apiserver,按照控制台指引查看链路信息。

    • 调用链分析页签:API Server请求的调用链路、应用拓扑等。

      下方仅介绍主要页签。如需了解不同页签的详细说明,请参见应用详情的相关文档。
      • 在页面左上角的搜索框中输入resources.k8s.cluster.name : "集群ClusterId",可过滤展示指定集群的调用链。

        集群ClusterId可在集群列表获取。
      • 单击Trace列表的Trace ID,查看一个API Server请求的Trace详情,包括拓扑视图、涉及的服务数、调用的接口数等。

    • 提供服务页签:API Server API 接口的请求数、错误数、平均耗时等。

    • 依赖服务页签:API Server依赖的外部组件,例如访问etcd时的请求数、错误数、平均耗时等。

相关文档

如需监控集群数据面的链路数据,请参见为集群数据面组件启用链路追踪

  • 本页导读 (1)
  • 前提条件
  • 步骤一:为API Server开启链路追踪
  • 步骤二:在OpenTelemetry中查看调用链路数据
  • 相关文档