RAG Agent2026年3月1号正式收费

更新时间:
复制为 MD 格式

北京时间20260301起,RDS PostGreSQL RAG Agent服务开始正式收费。

计费时间

北京时间20260301

计费方式

RAG Agent采用按量计费模式,根据您实际调用的API类型和次数进行计费。

  • 计费公式:总费用 = Σ (各类型API单价 × 调用次数)

说明

每个阿里云账号在每个自然日可享受1000次的免费API调用额度。超出部分将按照下文的定价标准正常计费。

计费项

RAG Agent产生的费用将统一归入一个计费项中,方便您在账单中识别和管理。

  • 计费项名称:RDS-AI应用数据服务

API类型和调用定价

RAG Agent根据其内部调用的底层AI模型能力,划分了不同的API计费类型。不同类型的API单价不同。

API计费类型

主要能力

依赖的底层模型

单价(元/次)

Intermediate

  • Embedding

  • Rerank

  • qwen3-embedding-v4

  • gte-rerank-v2

0.0006

Advanced

  • 知识图谱构建(基于基础LLM模型)

  • 检索上下文总结

  • 文本解析

  • qwen3-flash

  • qwen3-vl-flash

0.0013

Expert

  • 知识图谱构建(基于基础LLM模型)

  • 检索上下文总结

  • qwen3-qwq

0.0096

Master

  • 多模态解析

  • qwen3-vl-plus

0.0210

RAG 能力与计量API关系

调用次数估算说明:

  • -: 不涉及。

  • :调用1次。

  • ✓✓:少量调用,通常为2-5次,与数据集数量相关。

  • ✓✓✓:多次调用,通常为5-10次,与文档切片(Chunk)数量相关。

  • ✓✓✓✓:大量调用,通常为10-100+次,与Chunk数量、实体和关系数量相关。

API

文本解析

多模态解析

Embedding

知识图谱构建

检索上下文总结

Rerank

documents/upload (标准)

-

-

✓✓✓

✓✓✓✓

-

-

documents/upload (多模态)

✓✓

✓✓✓

✓✓✓✓

-

-

documents/upload (音视频)

-

-

✓✓✓

✓✓✓✓

-

-

documents/text

-

-

✓✓✓

✓✓✓✓

-

-

query

-

-

-

✓✓

query/stream

-

-

-

✓✓

cross-query

-

-

✓✓

-

✓✓

✓✓

cross-query/context

-

-

✓✓

-

✓✓

cross-query/stream

-

-

✓✓

-

✓✓

✓✓

search

-

-

-

-

-

计费示例

计费示例参考RAG Agent计费说明

相关文档