本文介绍阿里云关系型数据库RDS PostgreSQL Supabase RAG Agent的计费方式、定价详情和计费示例。
计费方式
RAG Agent采用按量计费模式,根据您实际调用的API类型和次数进行计费。
计费公式:
总费用 = Σ (各类型API单价 × 调用次数)
每个阿里云账号在每个自然日可享受1000次的免费API调用额度。超出部分将按照下文的定价标准正常计费。
计费项
RAG Agent产生的费用将统一归入一个计费项中,方便您在账单中识别和管理。
计费项名称:
RDS-AI应用数据服务
API类型和调用定价
RAG Agent根据其内部调用的底层AI模型能力,划分了不同的API计费类型。不同类型的API单价不同。
API计费类型 | 主要能力 | 依赖的底层模型 | 单价(元/次) |
Intermediate |
|
| 0.0006 |
Advanced |
|
| 0.0013 |
Expert |
|
| 0.0096 |
Master |
|
| 0.0210 |
RAG 能力与计量API关系
调用次数估算说明:
-: 不涉及。✓:调用1次。✓✓:少量调用,通常为2-5次,与数据集数量相关。✓✓✓:多次调用,通常为5-10次,与文档切片(Chunk)数量相关。✓✓✓✓:大量调用,通常为10-100+次,与Chunk数量、实体和关系数量相关。
API | 文本解析 | 多模态解析 | Embedding | 知识图谱构建 | 检索上下文总结 | Rerank |
| - | - | ✓✓✓ | ✓✓✓✓ | - | - |
| ✓ | ✓✓ | ✓✓✓ | ✓✓✓✓ | - | - |
| - | - | ✓✓✓ | ✓✓✓✓ | - | - |
| - | - | ✓✓✓ | ✓✓✓✓ | - | - |
| - | - | ✓ | - | ✓✓ | ✓ |
| - | - | ✓ | - | ✓✓ | ✓ |
| - | - | ✓✓ | - | ✓✓ | ✓✓ |
| - | - | ✓✓ | - | ✓ | ✓✓ |
| - | - | ✓✓ | - | ✓✓ | ✓✓ |
| - | - | ✓ | - | - | - |
计费示例
本示例将引导您估算一次典型的RAG操作(上传包含图文的PDF文档并进行一次检索查询)可能产生的费用。
场景设定
操作:
上传一份包含丰富图文的PDF文档。
对该文档进行一次混合模式(mix-mode)并启用Rerank的检索增强查询。
文档与参数:
参数项
值
说明
文档字数
40,000 汉字
约 53,000 tokens(按 1 汉字 ≈ 1.3 tokens 估算)
图像数量
8 张
-
chunk_token_size1200
每个Chunk的最大Token数
chunk_overlap_token_size100
Chunk间的重叠Token数
entity_extract_max_gleaning1
知识图谱补充抽取轮数
预估实体数
80
根据文档内容和模型能力预估
预估关系数
60
根据文档内容和模型能力预估
步骤一:计算文档切片(Chunk)数量
系统首先会将长文档切分为多个小的文本块(Chunk)以便后续处理。
有效Chunk大小:
chunk_token_size-chunk_overlap_token_size= 1200 - 100 = 1100 tokens预估Chunk数量:总
tokens÷ 有效Chunk大小= 53,000 ÷ 1100 ≈ 48.18,向上取整为 49个。
步骤二:计算文档上传阶段的API调用量与费用
在调用 documents/upload 接口上传文档时,系统会执行解析、Embedding、知识图谱构建等一系列操作。
各能力调用次数分析:
文本解析:解析PDF文档结构,调用1次。
多模态解析:识别并理解8张图像,每张调用1次,共调用8次。
Embedding:
为49个文本Chunk生成向量:调用49次。
为80个实体生成向量:调用80次。
为60个关系生成向量:调用60次。
Embedding总调用:49 + 80 + 60 = 189次。
知识图谱构建:
对49个Chunk进行实体/关系抽取:调用49次。
对抽取的80个实体进行总结:调用80次。
对抽取的60个关系进行总结:调用60次。
知识图谱构建总调用:49 + 80 + 60 = 189次。
费用汇总(按API计费类型):
API计费类型
包含能力
预估调用次数
单价(元/次)
费用(元)
Intermediate
Embedding(Chunk/实体/关系)
189
0.0006
0.1134
Advanced
知识图谱构建、文本解析
189 + 1 = 190
0.0013
0.2470
Master
多模态解析
8
0.0210
0.1680
上传阶段总计
387
-
0.5284
步骤三:计算单次查询阶段的API调用量与费用
完成文档上传后,执行一次混合模式(mix mode)并启用rerank的查询。根据mix mode的机制,系统会进行多次向量检索,因此调用次数会增加。
各能力调用次数分析:
Embedding:在
mix mode下,系统可能会对用户问题进行转换或从不同知识源(如文本、实体)进行检索,共调用3次。Rerank:对初步检索结果进行重排序,以提升精准度,调用1次。
检索上下文总结:调用大模型(LLM)基于检索到的上下文生成最终答案,调用1次。
查询阶段总调用:3 + 1 + 1 = 5次。
费用汇总(按API计费类型):
假设本次查询使用Advanced级别的模型进行总结。
API计费类型
包含能力
调用次数
单价(元/次)
费用(元)
Intermediate
Embedding、Rerank
3 + 1 = 4
0.0006
0.0024
Advanced
检索上下文总结
1
0.0013
0.0013
查询阶段总计
5
-
0.0037
步骤四:总费用与优惠说明
本次操作预估总费用:
上传阶段费用+查询阶段费用= 0.5284 + 0.0037 = 0.5321 元总调用次数:
上传阶段调用次数+查询阶段调用次数= 387 + 5 = 392 次。
结合优惠活动:假设该操作是您当日首次使用RAG Agent,这392次调用将全部落入每日1000次的免费额度内。因此,您当日的实际账单费用为 0 元。如果您当日后续的调用超出了剩余的免费额度(1000 - 392 = 608次),超出部分将开始计费。