为了快速定位性能瓶颈、排查集群问题,建议为集群API Server启用链路追踪,记录其请求交互细节。启用后,API Server的链路信息将自动上报至可观测链路 OpenTelemetry 版,提供可视化的链路明细、实时拓扑等监控数据。
如果您不熟悉链路追踪,可参见基本概念了解相关基础概念。
前提条件
已创建1.28及以上的ACK托管集群Pro版。如需升级,请参见手动升级集群。
已开通可观测链路 OpenTelemetry 版并授权,请参见准备工作。
可观测链路 OpenTelemetry 版为分布式应用提供了完整的调用链路还原、调用请求量统计、链路拓扑、应用依赖分析等工具。
使用本功能时,除ACK集群产生的费用外,还会产生可观测数据量计费,由可观测链路 OpenTelemetry 版收取。关于可观测链路 OpenTelemetry 版提供的免费额度和具体定价,请参见计费说明。
您可以配置API Server参数,开启链路追踪并配置链路追踪的采样率。配置后,可观测链路 OpenTelemetry 版控制台将展示详细的调用链路数据。
步骤一:为API Server开启链路追踪
登录容器服务管理控制台,在左侧导航栏选择集群列表。
在集群列表页面,单击目标集群名称,然后在左侧导航栏,选择 。
在核心组件区域,单击Kube API Server卡片右下方的配置。
在配置面板,定位enableTrace和samplingRatePerMillion参数,按照页面提示完成配置。
enableTrace:为API Server开启链路追踪功能。
samplingRatePerMillion:控制采样率,决定每一百万次请求中被采样的比例。您可以根据集群的负载情况配置采样率。
例如,1000000表示100%的采样率,即每一百万次请求中,所有请求都会被采样和记录;100000表示10%的采样率;10000表示1%的采样率。
步骤二:在OpenTelemetry中查看调用链路数据
登录可观测链路 OpenTelemetry 版控制台,在左侧导航栏单击应用列表。
在页面顶部选择地域,然后单击应用名称apiserver,按照控制台指引查看链路信息。
调用链分析页签:API Server请求的调用链路、应用拓扑等。
下方仅介绍主要页签。如需了解不同页签的详细说明,请参见应用详情的相关文档。
在页面左上角的搜索框中输入
resources.k8s.cluster.name : "集群ClusterId"
,可过滤展示指定集群的调用链。集群ClusterId可在集群列表获取。
单击Trace列表的Trace ID,查看一个API Server请求的Trace详情,包括拓扑视图、涉及的服务数、调用的接口数等。
提供服务页签:API Server API 接口的请求数、错误数、平均耗时等。
依赖服务页签:API Server依赖的外部组件,例如访问etcd时的请求数、错误数、平均耗时等。
相关文档
如需监控集群数据面的链路数据,请参见为集群数据面组件启用链路追踪。
- 本页导读 (1)
- 前提条件
- 步骤一:为API Server开启链路追踪
- 步骤二:在OpenTelemetry中查看调用链路数据
- 相关文档