RAG Agent计费说明

本文介绍阿里云关系型数据库RDS PostgreSQL Supabase RAG Agent的计费方式、定价详情和计费示例。

计费方式

RAG Agent采用按量计费模式,根据您实际调用的API类型和次数进行计费。

  • 计费公式:总费用 = Σ (各类型API单价 × 调用次数)

说明

每个阿里云账号在每个自然日可享受1000次的免费API调用额度。超出部分将按照下文的定价标准正常计费。

计费项

RAG Agent产生的费用将统一归入一个计费项中,方便您在账单中识别和管理。

  • 计费项名称:RDS-AI应用数据服务

API类型和调用定价

RAG Agent根据其内部调用的底层AI模型能力,划分了不同的API计费类型。不同类型的API单价不同。

API计费类型

主要能力

依赖的底层模型

单价(元/次)

Intermediate

  • Embedding

  • Rerank

  • qwen3-embedding-v4

  • gte-rerank-v2

0.0006

Advanced

  • 知识图谱构建(基于基础LLM模型)

  • 检索上下文总结

  • 文本解析

  • qwen3-flash

  • qwen3-vl-flash

0.0013

Expert

  • 知识图谱构建(基于基础LLM模型)

  • 检索上下文总结

  • qwen3-qwq

0.0096

Master

  • 多模态解析

  • qwen3-vl-plus

0.0210

RAG 能力与计量API关系

调用次数估算说明:

  • -: 不涉及。

  • :调用1次。

  • ✓✓:少量调用,通常为2-5次,与数据集数量相关。

  • ✓✓✓:多次调用,通常为5-10次,与文档切片(Chunk)数量相关。

  • ✓✓✓✓:大量调用,通常为10-100+次,与Chunk数量、实体和关系数量相关。

API

文本解析

多模态解析

Embedding

知识图谱构建

检索上下文总结

Rerank

documents/upload (标准)

-

-

✓✓✓

✓✓✓✓

-

-

documents/upload (多模态)

✓✓

✓✓✓

✓✓✓✓

-

-

documents/upload (音视频)

-

-

✓✓✓

✓✓✓✓

-

-

documents/text

-

-

✓✓✓

✓✓✓✓

-

-

query

-

-

-

✓✓

query/stream

-

-

-

✓✓

cross-query

-

-

✓✓

-

✓✓

✓✓

cross-query/context

-

-

✓✓

-

✓✓

cross-query/stream

-

-

✓✓

-

✓✓

✓✓

search

-

-

-

-

-

计费示例

本示例将引导您估算一次典型的RAG操作(上传包含图文的PDF文档并进行一次检索查询)可能产生的费用。

场景设定

  • 操作

    1. 上传一份包含丰富图文的PDF文档。

    2. 对该文档进行一次混合模式(mix-mode)并启用Rerank的检索增强查询。

  • 文档与参数

    参数项

    说明

    文档字数

    40,000 汉字

    约 53,000 tokens(按 1 汉字 ≈ 1.3 tokens 估算)

    图像数量

    8 张

    -

    chunk_token_size

    1200

    每个Chunk的最大Token

    chunk_overlap_token_size

    100

    Chunk间的重叠Token

    entity_extract_max_gleaning

    1

    知识图谱补充抽取轮数

    预估实体数

    80

    根据文档内容和模型能力预估

    预估关系数

    60

    根据文档内容和模型能力预估

步骤一:计算文档切片(Chunk)数量

系统首先会将长文档切分为多个小的文本块(Chunk)以便后续处理。

  • 有效Chunk大小chunk_token_size - chunk_overlap_token_size = 1200 - 100 = 1100 tokens

  • 预估Chunk数量:总tokens ÷ 有效Chunk大小 = 53,000 ÷ 1100 ≈ 48.18,向上取整为 49个。

步骤二:计算文档上传阶段的API调用量与费用

在调用 documents/upload 接口上传文档时,系统会执行解析、Embedding、知识图谱构建等一系列操作。

  1. 各能力调用次数分析

    • 文本解析:解析PDF文档结构,调用1次。

    • 多模态解析:识别并理解8张图像,每张调用1次,共调用8次。

    • Embedding

      • 49个文本Chunk生成向量:调用49次。

      • 80个实体生成向量:调用80次。

      • 60个关系生成向量:调用60次。

      • Embedding总调用:49 + 80 + 60 = 189次。

    • 知识图谱构建

      • 49Chunk进行实体/关系抽取:调用49次。

      • 对抽取的80个实体进行总结:调用80次。

      • 对抽取的60个关系进行总结:调用60次。

      • 知识图谱构建总调用:49 + 80 + 60 = 189次。

  2. 费用汇总(按API计费类型)

    API计费类型

    包含能力

    预估调用次数

    单价(元/次)

    费用(元)

    Intermediate

    Embedding(Chunk/实体/关系)

    189

    0.0006

    0.1134

    Advanced

    知识图谱构建、文本解析

    189 + 1 = 190

    0.0013

    0.2470

    Master

    多模态解析

    8

    0.0210

    0.1680

    上传阶段总计

    387

    -

    0.5284

步骤三:计算单次查询阶段的API调用量与费用

完成文档上传后,执行一次混合模式(mix mode)并启用rerank的查询。根据mix mode的机制,系统会进行多次向量检索,因此调用次数会增加。

  1. 各能力调用次数分析

    • Embedding:在mix mode下,系统可能会对用户问题进行转换或从不同知识源(如文本、实体)进行检索,共调用3次。

    • Rerank:对初步检索结果进行重排序,以提升精准度,调用1次。

    • 检索上下文总结:调用大模型(LLM)基于检索到的上下文生成最终答案,调用1次。

    • 查询阶段总调用:3 + 1 + 1 = 5次。

  2. 费用汇总(按API计费类型)

    假设本次查询使用Advanced级别的模型进行总结。

    API计费类型

    包含能力

    调用次数

    单价(元/次)

    费用(元)

    Intermediate

    Embedding、Rerank

    3 + 1 = 4

    0.0006

    0.0024

    Advanced

    检索上下文总结

    1

    0.0013

    0.0013

    查询阶段总计

    5

    -

    0.0037

步骤四:总费用与优惠说明

  • 本次操作预估总费用:上传阶段费用 + 查询阶段费用 = 0.5284 + 0.0037 = 0.5321 元

  • 总调用次数:上传阶段调用次数 + 查询阶段调用次数 = 387 + 5 = 392 次。

结合优惠活动:假设该操作是您当日首次使用RAG Agent,这392次调用将全部落入每日1000次的免费额度内。因此,您当日的实际账单费用为 0 元。如果您当日后续的调用超出了剩余的免费额度(1000 - 392 = 608次),超出部分将开始计费。

相关文档