配置EAS链路追踪

RAG服务的官方镜像已内置基于OpenTelemetry标准实现的自动化埋点功能和ARMS采集组件,可追踪LLM服务的链路数据,帮助您直观地调试和分析不同操作类型的输入输出、Token消耗、错误数以及响应时间等关键信息,提升系统的可观测性、调试效率。本文为您介绍如何为RAG服务配置EAS链路追踪。

获取OpenTelemetry接入点和鉴权Token

开通ARMS并按照如下操作步骤获取OpenTelemetry接入点和鉴权Token。

  1. 登录ARMS控制台,在左侧导航栏单击接入中心,并在服务端应用区域单击OpenTelemetry卡片。image

  2. OpenTelemetry配置面板的开始接入Tab页,配置以下参数,然后复制接入点鉴权Token信息。

    • 选择地域:请选择需要上报数据的地域,建议与RAG服务所属地域保持一致。

    • 连接方式:若您的RAG服务所属地域与选择的接入地域一致,推荐使用阿里云内网方式,否则选择公网方式

    • 上报方式:仅支持gRPC方式,请选择gRPC

    image

启用和配置链路追踪

启用链路追踪

模型在线服务(EAS)页面部署或更新RAG服务时,您可以启用链路追踪功能:

  • 部署RAG服务:关键配置说明如下,更多参数的详细配置说明,请参见自定义部署RAG服务

    参数

    描述

    基本信息

    标签

    单击image,添加如下标签:

    • 标签键:EnableTrace

    • 标签值:true

    环境信息

    镜像配置

    选择官方镜像 > pai-rag:0.3.4

    说明

    仅支持pai-rag:0.3.4及以上版本,由于版本迭代迅速,部署时镜像版本选择最高版本即可。

    服务接入

    专有网络(VPC)

    必须配置专有网络。因EAS服务默认不通公网,若在获取OpenTelemetry接入点和鉴权Token时,选择公网连接方式,则需选择具有公网访问能力的专有网络,确保EAS支持访问公网,详情请参见场景一:让EAS服务访问公网

    交换机

    安全组名称

  • 更新RAG服务:如果您已通过自定义方式部署了RAG服务,也可以在模型在线服务(EAS)页面,单击目标服务操作列下的更新,在更新服务页面中,将上述参数修改为目标配置。

配置链路追踪

  1. 模型在线服务(EAS)页面,单击目标RAG服务的服务方式列下的查看Web应用

  2. 系统设置OpenTelemetry链路追踪Tab页,配置以下参数,选中开启OpenTelemetry链路追踪,然后单击保存OpenTelemetry信息

    • 应用名称(EAS服务名称):配置为RAG服务名称。

    • OpenTelemetry接入点gRPC Endpoint:配置为已获取的接入点信息。

    • OpenTelemetry鉴权Token:配置为已获取的鉴权Token信息。

    image

查看调用链路

调用服务

配置RAG服务

RAG服务的WebUI页面中,您需完成必要的配置,以便进行服务推理。以调用LLM服务进行知识库问答为例,您需完成以下配置:

  • 配置LLM服务连接信息

    1. 部署LLM大语言模型服务,并获取服务访问地址和Token。详情请参见LLM大语言模型部署

    2. WebUI页面的系统设置页面中,切换到模型及存储配置Tab页,配置LLM服务连接信息,并单击保存模型配置

      • URL:配置为LLM服务访问地址。

      • 密钥:配置为LLM服务Token。

      • 模型名称:配置为LLM服务名称。

      image

  • 上传知识库文件

    WebUI页面的知识库页面中,上传知识库文件。具体操作,请参见RAG知识库管理

调用RAG服务

WebUI页面的对话Tab页,发送服务请求。image

查看链路信息

模型在线服务(EAS)页面,单击RAG服务名称。然后切换到链路追踪页签,查看链路追踪信息。image

单击目标链路操作列下的查看链路,进入Trace详情页面。该页面提供的Trace数据支持您查看服务的输入和输出信息,以及相关日志信息。image

常见问题

链路追踪查不到信息如何排查?

通常情况下,问题可能由以下几种原因导致,请逐一排查:

  • 应用名称不一致:

    配置的应用名称与RAG服务名称不一致,日志记录关联到了其他服务。请检查配置的应用名称是否正确,详情请参见配置链路追踪

  • 地域不一致:

    OpenTelemetry接入点gRPC Endpoint使用了内网地址,但选择的接入地域与RAG服务所属地域不一致。请确保两者位于同一地域。

  • 未开通公网访问:

    OpenTelemetry接入点gRPC Endpoint使用了公网地址,但RAG服务未开通公网访问(EAS服务默认不通公网)。请为RAG服务接入具有公网访问能力的专有网络,详情请参见启用链路追踪

  • 鉴权Token配置错误:

    OpenTelemetry鉴权Token配置错误时,日志中可能会出现如下报错信息。

    [2025-07-03 15:24:43] 2025-07-03 15:24:43.188 | 1056 | ERROR    | logging:callHandlers:1706 - Failed to export traces to tracing-analysis-dc-hz-internal.aliyuncs.com:8090, error code: StatusCode.PERMISSION_DENIED

    请检查配置的Token是否与获取的Token一致,详情请参见配置链路追踪