总览页面提供 AI Agent 可观测的全局视图,通过核心指标卡片和多维度统计表格,帮助您一站式掌握所有 AI Agent、模型和智能体框架的整体运行状态、性能表现和资源消耗情况。
前提条件
已开通云监控2.0服务并创建工作空间。
已将 AI Agent 接入可观测平台。
操作路径
登录云监控2.0控制台,选择目标工作空间,在左侧导航栏选择AI Agent可观测,默认进入总览页签。
核心指标
页面顶部展示以下核心指标卡片,每个指标均支持日同比对比,帮助您快速感知整体变化趋势:
指标名称 | 说明 |
活跃会话数 | 统计时间范围内产生交互的会话总数。日同比数据反映会话活跃度的变化。 |
对话数 | 统计时间范围内的对话总轮次。一个会话可能包含多轮对话。 |
活跃Agent数 | 统计时间范围内有调用记录的 AI Agent 数量。 |
活跃AI应用数 | 统计时间范围内有调用记录的 AI 应用数量。 |
Token消耗 | 统计时间范围内所有请求消耗的 Token 总量(含输入和输出)。 |
平均TTFT | Time To First Token,即从发起请求到返回第一个 Token 的平均耗时。该指标直接反映用户的感知响应速度。 |
每个指标卡片右上方提供展开、收藏和更多操作按钮,您可以将指标卡片全屏查看或添加到收藏夹。
模型调用统计
模型调用统计表格展示各大模型的调用量和性能指标,帮助您了解不同模型的使用情况和性能差异。
字段 | 说明 |
模型名称 | 被调用模型的标识名称,例如 qwen3-coder-plus、qwen-max 等。 |
Token消耗 | 该模型在统计时间范围内消耗的 Token 总量。 |
调用量 | 该模型在统计时间范围内的总调用次数。 |
错误数 | 该模型在统计时间范围内的调用错误次数。 |
平均耗时 | 该模型处理单次请求的平均响应时间。 |
平均TTFT | 该模型返回首个 Token 的平均耗时。 |
平均TPOT | Time Per Output Token,该模型生成每个输出 Token 的平均时间。 |
输入token | 该模型在统计时间范围内消耗的输入 Token 总量。 |
输出token | 该模型在统计时间范围内生成的输出 Token 总量。 |
所有列均支持排序和搜索,您可以单击列标题进行升序/降序排列,或单击搜索图标按关键字过滤。
Agent调用统计
Agent调用统计表格展示各 AI Agent 的调用量、大模型使用情况和性能指标,帮助您定位高负载或异常 Agent。
字段 | 说明 |
Agent名称 | AI Agent 的标识名称。 |
Token消耗 | 该 Agent 在统计时间范围内消耗的 Token 总量。 |
调用次数 | 该 Agent 在统计时间范围内被调用的总次数。 |
LLM调用量 | 该 Agent 发起的大模型调用次数。一次 Agent 调用可能触发多次 LLM 调用。 |
LLM平均耗时 | 该 Agent 中大模型调用的平均响应时间。 |
平均TTFT | 该 Agent 中大模型返回首个 Token 的平均耗时。 |
平均TPOT | 该 Agent 中大模型生成每个输出 Token 的平均时间。 |
输入token | 该 Agent 在统计时间范围内消耗的输入 Token 总量。 |
输出token | 该 Agent 在统计时间范围内生成的输出 Token 总量。 |
智能体框架统计
智能体框架统计表格按框架维度汇总展示 AI Agent 的整体使用情况,帮助您对比不同框架的规模和性能表现。
字段 | 说明 |
智能体框架 | AI Agent 使用的框架名称,例如 claude、codex、hermes-agent 等。 |
对话数 | 该框架下 Agent 产生的对话总数。 |
会话数 | 该框架下 Agent 产生的会话总数。 |
Agent数 | 该框架下接入的 Agent 数量。 |
LLM调用量 | 该框架下所有 Agent 发起的大模型调用总次数。 |
LLM平均耗时 | 该框架下大模型调用的平均响应时间。 |
平均TTFT | 该框架下大模型返回首个 Token 的平均耗时。 |
平均TPOT | 该框架下大模型生成每个输出 Token 的平均时间。 |
输入token | 该框架下所有 Agent 消耗的输入 Token 总量。 |
输出token | 该框架下所有 Agent 生成的输出 Token 总量。 |
每个统计表格右上方均提供设置、全屏展开、收藏和更多操作按钮。表格底部显示数据总条数和分页控件。
常见使用场景
场景 | 操作建议 |
成本优化 | 关注Token消耗指标和模型调用统计表,识别 Token 消耗量最大的模型,评估是否需要切换至成本更低的模型。 |
性能瓶颈排查 | 对比各模型/Agent 的平均耗时和 TTFT 指标,定位响应最慢的环节并针对性优化。 |
容量评估 | 观察活跃会话数和活跃 Agent 数的日同比趋势,预判业务增长带来的资源需求变化。 |
异常检测 | 关注模型调用统计中的错误数字段,及时发现调用失败率异常升高的模型。 |