为LLM(Large Language Model)应用安装Python探针后,ARMS即可开始监控LLM应用,您可以在概览页面了解LLM应用的大模型调用次数、Token使用次数、Trace数、会话数等信息。
前提条件
已为LLM应用安装探针,具体操作,请参见LLM 大语言模型应用接入 ARMS。
查看LLM应用概览
登录ARMS控制台,在左侧导航栏选择 。
在应用列表页面顶部选择目标地域,然后单击目标应用名称。
在上方导航栏单击概览。
大盘说明
面板 | 说明 |
模型调用次数 | 应用的大语言模型在指定时间段内被调用的次数。 |
Token使用 | 应用的Token在指定时间段内被使用的次数。 |
Trace数 | 应用在指定时间段产生的调用链数量。 |
Span数 | 应用在指定时间段产生的Span数量。 |
会话数 | 应用在指定时间段产生的会话数量。 |
用户数 | 应用在指定时间段内的用户数量。 |
操作类型分布 |
|
Avg LLM call per request | 1分钟内平均1次请求调用的大语言模型次数。 |
Request数趋势 | LLM应用每分钟的请求数趋势图。 |
模型调用排行 | LLM应用中被调用次数最多的大语言模型Top 5。 |
Request数用户排行 | LLM应用中发起请求最多的用户Top 5。 |
会话数趋势 | LLM应用每分钟的会话数趋势图。 |