总览

更新时间:
复制 MD 格式

总览页面提供 AI Agent 可观测的全局视图,通过核心指标卡片和多维度统计表格,帮助您一站式掌握所有 AI Agent、模型和智能体框架的整体运行状态、性能表现和资源消耗情况。

前提条件

  • 已开通云监控2.0服务并创建工作空间。

  • 已将 AI Agent 接入可观测平台。

操作路径

登录云监控2.0控制台,选择目标工作空间,在左侧导航栏选择AI Agent可观测,默认进入总览页签。

核心指标

页面顶部展示以下核心指标卡片,每个指标均支持日同比对比,帮助您快速感知整体变化趋势:

指标名称

说明

活跃会话数

统计时间范围内产生交互的会话总数。日同比数据反映会话活跃度的变化。

对话数

统计时间范围内的对话总轮次。一个会话可能包含多轮对话。

活跃Agent

统计时间范围内有调用记录的 AI Agent 数量。

活跃AI应用数

统计时间范围内有调用记录的 AI 应用数量。

Token消耗

统计时间范围内所有请求消耗的 Token 总量(含输入和输出)。

平均TTFT

Time To First Token,即从发起请求到返回第一个 Token 的平均耗时。该指标直接反映用户的感知响应速度。

说明

每个指标卡片右上方提供展开、收藏和更多操作按钮,您可以将指标卡片全屏查看或添加到收藏夹。

模型调用统计

模型调用统计表格展示各大模型的调用量和性能指标,帮助您了解不同模型的使用情况和性能差异。

字段

说明

模型名称

被调用模型的标识名称,例如 qwen3-coder-plus、qwen-max 等。

Token消耗

该模型在统计时间范围内消耗的 Token 总量。

调用量

该模型在统计时间范围内的总调用次数。

错误数

该模型在统计时间范围内的调用错误次数。

平均耗时

该模型处理单次请求的平均响应时间。

平均TTFT

该模型返回首个 Token 的平均耗时。

平均TPOT

Time Per Output Token,该模型生成每个输出 Token 的平均时间。

输入token

该模型在统计时间范围内消耗的输入 Token 总量。

输出token

该模型在统计时间范围内生成的输出 Token 总量。

说明

所有列均支持排序和搜索,您可以单击列标题进行升序/降序排列,或单击搜索图标按关键字过滤。

Agent调用统计

Agent调用统计表格展示各 AI Agent 的调用量、大模型使用情况和性能指标,帮助您定位高负载或异常 Agent。

字段

说明

Agent名称

AI Agent 的标识名称。

Token消耗

该 Agent 在统计时间范围内消耗的 Token 总量。

调用次数

该 Agent 在统计时间范围内被调用的总次数。

LLM调用量

该 Agent 发起的大模型调用次数。一次 Agent 调用可能触发多次 LLM 调用。

LLM平均耗时

该 Agent 中大模型调用的平均响应时间。

平均TTFT

该 Agent 中大模型返回首个 Token 的平均耗时。

平均TPOT

该 Agent 中大模型生成每个输出 Token 的平均时间。

输入token

该 Agent 在统计时间范围内消耗的输入 Token 总量。

输出token

该 Agent 在统计时间范围内生成的输出 Token 总量。

智能体框架统计

智能体框架统计表格按框架维度汇总展示 AI Agent 的整体使用情况,帮助您对比不同框架的规模和性能表现。

字段

说明

智能体框架

AI Agent 使用的框架名称,例如 claude、codex、hermes-agent 等。

对话数

该框架下 Agent 产生的对话总数。

会话数

该框架下 Agent 产生的会话总数。

Agent

该框架下接入的 Agent 数量。

LLM调用量

该框架下所有 Agent 发起的大模型调用总次数。

LLM平均耗时

该框架下大模型调用的平均响应时间。

平均TTFT

该框架下大模型返回首个 Token 的平均耗时。

平均TPOT

该框架下大模型生成每个输出 Token 的平均时间。

输入token

该框架下所有 Agent 消耗的输入 Token 总量。

输出token

该框架下所有 Agent 生成的输出 Token 总量。

说明

每个统计表格右上方均提供设置、全屏展开、收藏和更多操作按钮。表格底部显示数据总条数和分页控件。

常见使用场景

场景

操作建议

成本优化

关注Token消耗指标和模型调用统计表,识别 Token 消耗量最大的模型,评估是否需要切换至成本更低的模型。

性能瓶颈排查

对比各模型/Agent 的平均耗时和 TTFT 指标,定位响应最慢的环节并针对性优化。

容量评估

观察活跃会话数和活跃 Agent 数的日同比趋势,预判业务增长带来的资源需求变化。

异常检测

关注模型调用统计中的错误数字段,及时发现调用失败率异常升高的模型。