RAG Agent计费说明-云数据库 RDS(RDS)-阿里云帮助中心

本文介绍阿里云关系型数据库RDS PostgreSQL Supabase RAG Agent的计费方式、定价详情和计费示例。

计费方式

RAG Agent采用按量计费模式，根据您实际调用的API类型和次数进行计费。

RAG Agent产生的费用将统一归入一个计费项中，方便您在账单中识别和管理。

RAG Agent根据其内部调用的底层AI模型能力，划分了不同的API计费类型。不同类型的API单价不同。

API计费类型	主要能力	依赖的底层模型	单价（元/次）
Intermediate	Embedding Rerank	`qwen3-embedding-v4` `gte-rerank-v2`	0.0006
Advanced	知识图谱构建（基于基础LLM模型）检索上下文总结文本解析	`qwen3-flash` `qwen3-vl-flash`	0.0013
Expert	知识图谱构建（基于基础LLM模型）检索上下文总结	`qwen3-qwq`	0.0096
Master	多模态解析	`qwen3-vl-plus`	0.0210

调用次数估算说明：

本示例将引导您估算一次典型的RAG操作（上传包含图文的PDF文档并进行一次检索查询）可能产生的费用。

文档与参数：

系统首先会将长文档切分为多个小的文本块（Chunk）以便后续处理。

有效Chunk大小：chunk_token_size - chunk_overlap_token_size = 1200 - 100 = 1100 tokens
预估Chunk数量：总tokens ÷ 有效Chunk大小 = 53,000 ÷ 1100 ≈ 48.18，向上取整为 49个。

在调用 documents/upload 接口上传文档时，系统会执行解析、Embedding、知识图谱构建等一系列操作。

各能力调用次数分析：
- 文本解析：解析PDF文档结构，调用1次。
- 多模态解析：识别并理解8张图像，每张调用1次，共调用8次。
- Embedding：
  - 为49个文本Chunk生成向量：调用49次。
  - 为80个实体生成向量：调用80次。
  - 为60个关系生成向量：调用60次。
  - Embedding总调用：49 + 80 + 60 = 189次。
- 知识图谱构建：
  - 对49个Chunk进行实体/关系抽取：调用49次。
  - 对抽取的80个实体进行总结：调用80次。
  - 对抽取的60个关系进行总结：调用60次。
  - 知识图谱构建总调用：49 + 80 + 60 = 189次。

费用汇总（按API计费类型）：

完成文档上传后，执行一次混合模式（mix mode）并启用rerank的查询。根据mix mode的机制，系统会进行多次向量检索，因此调用次数会增加。

各能力调用次数分析：
- Embedding：在mix mode下，系统可能会对用户问题进行转换或从不同知识源（如文本、实体）进行检索，共调用3次。
- Rerank：对初步检索结果进行重排序，以提升精准度，调用1次。
- 检索上下文总结：调用大模型（LLM）基于检索到的上下文生成最终答案，调用1次。
- 查询阶段总调用：3 + 1 + 1 = 5次。
费用汇总（按API计费类型）：
假设本次查询使用Advanced级别的模型进行总结。
API计费类型
包含能力
调用次数
单价（元/次）
费用（元）
Intermediate
Embedding、Rerank
3 + 1 = 4
0.0006
0.0024
Advanced
检索上下文总结
1
0.0013
0.0013
查询阶段总计
5
-
0.0037

结合优惠活动：假设该操作是您当日首次使用RAG Agent，这392次调用将全部落入每日1000次的免费额度内。因此，您当日的实际账单费用为 0 元。如果您当日后续的调用超出了剩余的免费额度（1000 - 392 = 608次），超出部分将开始计费。