LLM指标说明

本文介绍了LLM中常见的指标,您可以使用这些指标自定义Grafana大盘。

公共Label

维度名称

维度Key

示例

服务名称

service

llm-rag-demo

服务PID

pid

ggxw4lnjuz@0cb8619bb54****

机器IP

serverIp

127.0.0.1

接口

rpc

query

应用来源

source

  • xtrace:表示可观测链路 OpenTelemetry 版

  • apm:表示应用实时监控服务 ARMS。

请求指标

说明

原则上埋点支持的不同协议或者调用类型均可以覆盖到,分为提供服务、依赖服务等。更多信息,请参见JAVA应用的应用监控指标说明

指标名称

指标

指标类型

采集间隔

单位

维度

总请求数

arms_$callType_requests_count

Gauge

15s

不同服务访问类型维度不同。详细信息,请参见应用监控指标说明

错误请求数

arms_$callType_requests_error_count

Gauge

15s

总请求耗时

arms_$callType_requests_seconds

Gauge

15s

慢请求数

arms_$callType_requests_slow_count

Gauge

15s

LLM指标

在公共基础Label上可能还存在如下Label:modelName、spanKind、usageType。

维度名称

维度Key

示例

说明

模型名称

modelName

  • gpt-4

  • text-davinci-003

操作类型

spanKind

LLM、CHAIN、EMBEDDING等,请参见LLM Trace字段定义说明

使用类型

usageType

  • input

  • output

Token相关指标专用。

操作类型

指标名称

指标

指标类型

采集间隔

单位

维度

调用LLM的请求次数

genai_calls_count

Gauge

1m

  • modelName

  • spanKind

调用LLM的响应耗时

genai_calls_duration_seconds

Gauge

1m

  • modelName

  • spanKind

调用LLM的错误次数

genai_calls_error_count

Gauge

1m

  • modelName

  • spanKind

调用LLM的慢调用次数

genai_calls_slow_count

Gauge

1m

  • modelName

  • spanKind

大模型性能

指标名称

指标

指标类型

采集间隔

单位

维度

调用LLM首包响应耗时

genai_llm_first_token_seconds

Gauge

1m

  • modelName

  • spanKind

大模型用量

指标名称

指标

指标类型

采集间隔

单位

维度

Tokens消耗统计

genai_llm_usage_tokens

Gauge

1m

  • modelName

  • spanKind

  • usageType

    • input

    • output