RAG服务的官方镜像已内置基于OpenTelemetry标准实现的自动化埋点功能和ARMS采集组件,可追踪LLM服务的链路数据,帮助您直观地调试和分析不同操作类型的输入输出、Token消耗、错误数以及响应时间等关键信息,提升系统的可观测性、调试效率。本文为您介绍如何为RAG服务配置EAS链路追踪。
获取OpenTelemetry接入点和鉴权Token
开通ARMS并按照如下操作步骤获取OpenTelemetry接入点和鉴权Token。
登录ARMS控制台,在左侧导航栏单击接入中心,并在服务端应用区域单击OpenTelemetry卡片。
在OpenTelemetry配置面板的开始接入Tab页,配置以下参数,然后复制接入点和鉴权Token信息。
选择地域:请选择需要上报数据的地域,建议与RAG服务所属地域保持一致。
连接方式:若您的RAG服务所属地域与选择的接入地域一致,推荐使用阿里云内网方式,否则选择公网方式。
上报方式:仅支持gRPC方式,请选择gRPC。
启用和配置链路追踪
启用链路追踪
在模型在线服务(EAS)页面部署或更新RAG服务时,您可以启用链路追踪功能:
部署RAG服务:关键配置说明如下,更多参数的详细配置说明,请参见自定义部署RAG服务。
参数
描述
基本信息
标签
单击
,添加如下标签:
标签键:EnableTrace
标签值:true
环境信息
镜像配置
选择
。说明仅支持pai-rag:0.3.4及以上版本,由于版本迭代迅速,部署时镜像版本选择最高版本即可。
服务接入
专有网络(VPC)
必须配置专有网络。因EAS服务默认不通公网,若在获取OpenTelemetry接入点和鉴权Token时,选择公网连接方式,则需选择具有公网访问能力的专有网络,确保EAS支持访问公网,详情请参见场景一:让EAS服务访问公网。
交换机
安全组名称
更新RAG服务:如果您已通过自定义方式部署了RAG服务,也可以在模型在线服务(EAS)页面,单击目标服务操作列下的更新,在更新服务页面中,将上述参数修改为目标配置。
配置链路追踪
在模型在线服务(EAS)页面,单击目标RAG服务的服务方式列下的查看Web应用。
在系统设置的OpenTelemetry链路追踪Tab页,配置以下参数,选中开启OpenTelemetry链路追踪,然后单击保存OpenTelemetry信息。
应用名称(EAS服务名称):配置为RAG服务名称。
OpenTelemetry接入点gRPC Endpoint:配置为已获取的接入点信息。
OpenTelemetry鉴权Token:配置为已获取的鉴权Token信息。
查看调用链路
调用服务
配置RAG服务
在RAG服务的WebUI页面中,您需完成必要的配置,以便进行服务推理。以调用LLM服务进行知识库问答为例,您需完成以下配置:
配置LLM服务连接信息
部署LLM大语言模型服务,并获取服务访问地址和Token。详情请参见LLM大语言模型部署。
在WebUI页面的系统设置页面中,切换到模型及存储配置Tab页,配置LLM服务连接信息,并单击保存模型配置。
URL:配置为LLM服务访问地址。
密钥:配置为LLM服务Token。
模型名称:配置为LLM服务名称。
上传知识库文件
在WebUI页面的知识库页面中,上传知识库文件。具体操作,请参见RAG知识库管理。
调用RAG服务
在WebUI页面的对话Tab页,发送服务请求。
查看链路信息
在模型在线服务(EAS)页面,单击RAG服务名称。然后切换到链路追踪页签,查看链路追踪信息。
单击目标链路操作列下的查看链路,进入Trace详情页面。该页面提供的Trace数据支持您查看服务的输入和输出信息,以及相关日志信息。
常见问题
链路追踪查不到信息如何排查?
通常情况下,问题可能由以下几种原因导致,请逐一排查:
应用名称不一致:
配置的应用名称与RAG服务名称不一致,日志记录关联到了其他服务。请检查配置的应用名称是否正确,详情请参见配置链路追踪。
地域不一致:
OpenTelemetry接入点gRPC Endpoint使用了内网地址,但选择的接入地域与RAG服务所属地域不一致。请确保两者位于同一地域。
未开通公网访问:
OpenTelemetry接入点gRPC Endpoint使用了公网地址,但RAG服务未开通公网访问(EAS服务默认不通公网)。请为RAG服务接入具有公网访问能力的专有网络,详情请参见启用链路追踪。
鉴权Token配置错误:
OpenTelemetry鉴权Token配置错误时,日志中可能会出现如下报错信息。
[2025-07-03 15:24:43] 2025-07-03 15:24:43.188 | 1056 | ERROR | logging:callHandlers:1706 - Failed to export traces to tracing-analysis-dc-hz-internal.aliyuncs.com:8090, error code: StatusCode.PERMISSION_DENIED
请检查配置的Token是否与获取的Token一致,详情请参见配置链路追踪。