应用观测

通过应用观测,您可以查看百炼应用内部的全链路处理流程,并获取延时、Token量等指标,从而更有效地分析和优化您的百炼应用。

为什么做应用观测

尽管百炼应用具备强大的推理和文本生成能力,但由于其内部通常包含多个节点(如知识库),其高度复杂的架构为后续开发带来了诸多挑战,例如:

  • 追踪应用内部的调用过程。

  • 查看模型的响应延时。

  • 查看模型的思考过程。

为此,百炼提供了应用观测功能。只需简单配置,您即可端到端地查看业务空间内百炼应用的处理流程(例如向量生成、向量检索以及大模型调用等)并获取延时、Token量等指标(更新频率为分钟级)。

效果示例

追踪应用内部的调用过程

查看模型的响应延时

查看模型的思考过程

image

image

image

支持的应用

应用观测支持:智能体应用工作流应用,以及智能体编排应用

应用观测目前暂不支持通过Assistant API创建的智能体应用

快速开始

百炼目前暂未提供可用的API进行应用观测。
首次使用应用观测时,请先根据界面指引开通模型调用服务、可观测链路OpenTelemetry和相关策略(开通后通常分钟级生效,但高峰期可能会稍有延迟)。

1. 选择被观测的应用

访问应用观测,单击选择被观测的应用 > 添加。如果列表中没有您已创建的应用,可能是因为:

  • 该应用尚未发布

    您可以单击管理应用,在列表中找到您想要发布的应用后,单击管理 > 发布
  • 该应用不属于当前业务空间。

2. 开始观测

  1. 添加完成后,被观测的应用将出现在应用观测列表中。所有在该应用中输入的Prompt及其相应的数据和指标将被自动追踪,并同步至应用观测(频率为分钟级)。

    单击关闭观测后,应用的追踪数据将停止同步。重新添加后仅同步新增数据。
    应用总量应用平均延时等指标能帮助您优化应用的运营效果和成本。

    image

  1. 单击操作列的查看详情,查看过往3天内(最长可选15天)所有在该应用中输入的Prompt的内容、输出延时调用时间以及Token(说明参见附录)等概要信息。

    互动式体验:列表中的CHAIN节点表示一次完整的应用内部调用追踪,支持展开。查看应用观测支持的所有节点类型
    状态:包括正常错误(表示在执行该阶段逻辑时出现异常。建议您提交工单咨询具体原因)。

    image

    支持基于RequestIdTraceId,以及指定时间范围进行筛选。

    如何获取TraceId:单击指定节点的名称(如AgentApp)展开节点详情后,再单击查看ID
  1. 单击指定节点名称,即可查看Prompt经过该节点时的输入输出以及延时等指标(如有下属节点,支持展开)。

    image

计费说明

  • 应用观测功能本身不收费。

  • 应用观测产生的数据需要存储在可观测链路OpenTelemetry服务中,您需要支付相关的费用。关于OpenTelemetry服务的费用详情,请参见计费说明

附录

名词解释

名词

解释

节点

在应用观测中,节点是指被追踪的一个操作单元。每个节点具有名称类型等属性,并详细记录了操作的具体信息和起止时间。另外,节点之间还可以形成嵌套关系。

支持的节点类型

注意:以下节点仅在被触发或调用时展示。

智能体应用

节点类型

说明

CHAIN

Chain节点将大模型节点与其他类型的节点相连接,以实现复杂任务的处理。

Chain节点可以包含其它类型节点,例如RetrieverLLM等。

Chain作为根节点时,名称可能值为:AgentApp智能体应用)、WorkflowApp工作流应用)以及AgentflowApp智能体编排应用)。

AGENT

Agent节点表示对智能体的调用。

RETRIEVER

Retriever节点用于执行检索操作。KnowledgeRetriever表示在知识库中进行检索。

目前暂不支持观测在长期记忆中的检索过程。

作为KnowledgeRetriever的子节点时,Retriever有两种名称

  • TextRetriever:指触发了文本检索,文本相似度计算采用改进后的BM25算法,默认返回100个文本切片,暂不支持数量调整。

  • VectorRetriever:指触发了向量检索,默认返回100个文本切片,暂不支持数量调整。

REWRITER

Rewriter节点会基于会话上下文自动调整原始输入Prompt以提升知识检索效果。

EMBEDDING

Embedding节点用于将输入Prompt转化为数值化向量。

TokenEmbedding模型本次向量化了多少Token。

RERANKER

Reranker节点会计算每个输入文本切片的相似度分数并按此降序排列。

LLM

LLM节点表示调用大模型(如通义千问Plus)进行推理或者文本生成。

Token指模型输入Token数 + 模型输出Token数。
LLM节点的延时调用时长)包括输出回复的过程。

TOOL

Tool节点表示对插件的调用,支持官方插件自定义插件

例如调用计算器或者夸克搜索。

GUARDRAIL

Guardrail节点表示对阿里绿网的调用,用于实时监控、检测和拦截多种违规内容,例如赌博、色情等。

ManualIntervention指触发了您为智能体应用设定的干预规则;SystemIntervention指触发了系统干预规则。

工作流应用

节点类型

说明

CHAIN

Chain节点将大模型节点与其他类型的节点相连接,以实现复杂任务的处理。

Chain节点可以包含其它类型节点,例如RetrieverLLM等。

Chain作为根节点时,名称可能值为:AgentApp智能体应用)、WorkflowApp工作流应用)以及AgentflowApp智能体编排应用)。

START

表示开始节点

RETRIEVER

Retriever节点用于执行检索操作。KnowledgeRetriever表示在知识库中进行检索。

目前暂不支持观测在长期记忆中的检索过程。

作为KnowledgeRetriever的子节点时,Retriever有两种名称

  • TextRetriever:指触发了文本检索,文本相似度计算采用改进后的BM25算法,默认返回100个文本切片,暂不支持数量调整。

  • VectorRetriever:指触发了向量检索,默认返回100个文本切片,暂不支持数量调整。

REWRITER

Rewriter节点会基于会话上下文自动调整原始输入Prompt以提升知识检索效果。

EMBEDDING

Embedding节点用于将输入Prompt转化为数值化向量。

TokenEmbedding模型本次向量化了多少Token。

RERANKER

Reranker节点会计算每个输入文本切片的相似度分数并按此降序排列。

LLM

表示大模型节点

Token指模型输入Token数 + 模型输出Token数。
LLM节点的延时调用时长)包括输出回复的过程。

API

表示API节点

CLASSIFIER

表示意图分类节点

TEXT_CONVERTER

表示文本转换节点

SCRIPT

表示脚本转换节点

CONDITION

表示条件判断节点

FUNCTION_COMPUTE

表示函数计算节点

APP_FLOW

表示AppFlow节点

GUARDRAIL

Guardrail节点表示对阿里绿网的调用,用于实时监控、检测和拦截多种违规内容,例如赌博、色情等。

ManualIntervention指触发了您为智能体应用设定的干预规则;SystemIntervention指触发了系统干预规则。

END

表示结束节点

智能体编排应用

节点类型

说明

CHAIN

Chain节点将大模型节点与其他类型的节点相连接,以实现复杂任务的处理。

Chain节点可以包含其它类型节点,例如RetrieverLLM等。

Chain作为根节点时,名称可能值为:AgentApp智能体应用)、WorkflowApp工作流应用)以及AgentflowApp智能体编排应用)。

此外,智能体编排应用的Chain节点支持嵌套其它Chain节点。

ReferWorkflowApp指触发了一个已创建的智能体应用CustomAgentApp智能体创建

START

表示开始节点

RETRIEVER

Retriever节点用于执行检索操作。KnowledgeRetriever表示在知识库中进行检索。

目前暂不支持观测在长期记忆中的检索过程。

作为KnowledgeRetriever的子节点时,Retriever有两种名称

  • TextRetriever:指触发了文本检索,文本相似度计算采用改进后的BM25算法,默认返回100个文本切片,暂不支持数量调整。

  • VectorRetriever:指触发了向量检索,默认返回100个文本切片,暂不支持数量调整。

REWRITER

Rewriter节点会基于会话上下文自动调整原始输入Prompt以提升知识检索效果。

EMBEDDING

Embedding节点用于将输入Prompt转化为数值化向量。

TokenEmbedding模型本次向量化了多少Token。

RERANKER

Reranker节点会计算每个输入文本切片的相似度分数并按此降序排列。

LLM

表示大模型节点。

Token指模型输入Token数 + 模型输出Token数。
LLM节点的延时调用时长)包括输出回复的过程。

AGENT_GROUP

表示智能体群组节点

PLANNER

Planner节点将输入智能体群组节点的内容提供给决策大模型,并根据模型的推理结果来确定后续执行任务的智能体。

DECIDER

表示决策分类节点

TEXT_CONVERTER

表示文本转换节点

SCRIPT

表示脚本转换节点

GUARDRAIL

Guardrail节点表示对阿里绿网的调用,用于实时监控、检测和拦截多种违规内容,例如赌博、色情等。

ManualIntervention指触发了您为智能体应用设定的干预规则;SystemIntervention指触发了系统干预规则。

END

表示结束节点