阿里云百炼知识库服务自 2026 年 1 月 4 日起正式开始计费。本文详细说明了知识库的计费规则,包括费用构成、计算方式和成本优化策略。
针对在 2026 年 1 月 4 日知识库正式计费前,已有知识库数据但未开通知识库服务的用户:
在正式计费前您账户下创建的知识库实例及其中数据将为您免费保留至 2026 年 6 月 30 日。
逾期后,若您仍未开通服务,这些数据将被永久删除且无法恢复。请务必在此日期前开通知识库服务。
1. 计费方式
知识库采用按量付费(后付费)模式。
2. 费用组成
知识库的总费用由两部分构成:规格费用和模型调用费用。
2.1 规格费用
规格费用指知识库的运行时长费用。阿里云百炼提供两种知识库规格:标准版和旗舰版。
若选择使用自购的 ADB-PG 作为向量存储,则需额外支付其费用。
标准版:适用个人/小规模、PoC环境。
旗舰版:适用高并发、生产级环境。
规格 | 最高并发(检索知识库) | 存储空间 | 价格 |
标准版 | 1 QPS(固定值,不支持调整) | 平台存储 ≤ 100 GB | 0.03 元/知识库/小时 |
旗舰版 | 50-10,000 QPS(可调,对应 1-200 RCU) | 平台存储 ≤ 9,999 GB (如需更大存储空间,可在创建知识库时选择并配置自购的 ADB-PG 实例。参见操作指南-创建知识库) | 0.2 元/RCU/小时 |
RCU:RCU(Retrieval Compute Unit)是知识库检索并发能力度量单位。1 RCU ≈ 支撑在线检索最高 50 QPS。RCU 越大,可支撑并发数越高。
如何估算所需 RCU:所需 RCU 数量 = 向上取整(检索峰值 QPS 需求 ÷ 50)。例如,80 QPS 的峰值需求至少需要 2 RCU。
最高并发:指知识库本身的核心检索性能(不含依赖链路,例如调用排序模型)。
检索知识库(旗舰版)时,如遇极端情况下模型依赖链路限流(如Embedding、Rerank模型等),我们将以最快速度帮您扩容相关服务,但中途可能存在少量检索请求降级,效果会有短暂的下降。
存储空间费用:以上规格对应价格已含平台存储的费用;若您选择使用自购的 ADB-PG,则需额外支付其费用,价格以ADB-PG产品定价页为准。
变配:按变配发生时间分段计费。变配操作本身不收费。
免费额度说明
阿里云百炼为所有用户提供一次性 720 小时的知识库免费额度,免费额度耗尽后将按量付费。
老用户的免费额度有效期统一截至 2026 年 2 月 3 日 23:59,到期后将自动按量付费。
新用户的免费额度自开通之日起 30 天内有效。过期后剩余额度将作废,无法继续使用。
老用户指在 2026 年 1 月 4 日知识库正式计费前已开通服务的用户,新用户指在该日期(含当天)之后首次开通服务的用户。
可在知识库页面右上角点击查看账单,以查看剩余免费时长及有效期。

使用规则:
适用范围: 仅用于抵扣标准版知识库的规格费用,不适用于旗舰版。
扣除方式: 按实际运行时长累计扣除。
例如,同时运行 4 个标准版知识库,每小时扣除 4 小时额度。
不包含项目: 模型调用费用不在免费额度范围内,遵循模型本身的计费策略。
示例:
单个标准版知识库运行:720小时 ÷ 1个 = 可免费运行720小时
2个标准版知识库同时运行:720小时 ÷ 2个 = 可免费运行360小时
2.2 模型调用费用
在创建、更新或检索知识库时,会调用向量模型(用于内容向量化)和排序模型(Rerank,用于重排序),这些调用会产生费用。
模型调用费用是独立计费项,根据实际使用的输入 Token 量计算。其价格和免费额度策略遵循模型广场中对应模型的调用计费标准,不包含在知识库的规格费用中。
计费公式:模型费用 = (输入 Token 总数 / 1000) × 模型单价(元/千 Token)
阿里云百炼应用挂载了多个知识库时,会在多个知识库内执行检索,Token 消耗量(Query 向量化和 Rerank 排序)按知识库数量倍数增加(N 个知识库则消耗量 × N)。
2.2.1 创建/更新知识库
调用场景:上传新文件或增量更新时,调用向量模型对文本内容进行向量化处理。
计费说明:按新增内容的 Token 数量计费。删除文件不产生模型调用费用。
2.2.2 检索知识库
调用场景
调用向量模型,对用户的查询(Query)进行向量化。
调用排序模型(Rerank),对初步检索到的结果进行重新排序,以提升最终答案的精准度。
计费说明
Query 向量化费用:按用户输入内容的 Token 数计费。
Rerank 排序费用(可配置关闭):这是检索费用的主要部分。费用取决于初步召回的切片总量。
检索流程与计费关系详解
初步召回
系统根据以下参数从知识库中召回文本切片:
初步向量检索top k:控制基于语义相似性召回的相关切片数量(默认 50)
初步关键词检索top k:控制基于文本精确匹配召回的相关切片数量(默认 50)
重排序
所有初步召回的切片,都会被送入 Rerank 模型进行排序。
费用 = 初步召回总切片数 × 平均切片Token数 × 模型单价(参见模型调用计费)
重要排序模型费用取决于初步召回的总切片数,而非最终返回召回的切片数量。
最终召回
Rerank 模型排序后,系统会根据最终召回最大数量参数(例如 5)返回相应数量的切片。
2.2.3 费用优化建议
关闭排序 | 调整初步召回参数 |
如果您的应用场景对搜索精度要求不高,可关闭排序功能以消除排序模型费用。 相关文档:重排(Rerank)配置。
| 通过降低初步向量检索TopK和初步关键词检索TopK的数值,可减少送入排序模型的 Token 量,从而显著降低成本。
|
3. 计费示例
3.1 连续运行 1 天
规格 | 配置 | 数量 | 单日规格费用 | |
标准版 | 使用平台存储 | 1 | 24 小时 × 0.03 元/小时 = 0.72 元 | |
旗舰版 | 使用平台存储,1 RCU | 1 | 24 小时 × 1 RCU × 0.2 元/RCU/小时 = 4.80 元 | |
3.2 创建、更新与检索知识库
基于 text-embedding-v4(向量模型)与 qwen3-rerank(排序模型),价格均为 0.0005 元/千 Token。
计费逻辑:费用 = Token 消耗量(以“千 Token”为单位) × 模型单价
创建知识库
操作:上传含 50,000 Token 的文件进行向量化。
费用:50 × 0.0005 元/千 Token = 0.025 元
更新知识库
操作:新增含 20,000 Token 的文件。
费用:20 × 0.0005 元/千 Token = 0.01 元
检索知识库(单个)
操作:输入 100 Token 的查询(Query),召回 150 个相关切片(平均 500 Token/切片)进行排序。
费用:
Query 向量化:0.1 × 0.0005 元/千 Token = 0.00005 元
排序 Token 数: 150 个切片 × 500 Token/切片 = 75,000 Token
排序费用(如有):75 × 0.0005 元/千 Token = 0.0375 元
合计:0.00005 元(Query 向量化) + 0.0375 元(排序)= 0.03755 元
检索知识库(多个)
操作:阿里云百炼智能体应用关联 4 个知识库,同一 Query 在每个知识库中默认执行一次检索(无法更改)。
费用:0.03755 元/次 × 4 = 0.1502 元
3.3 配置变更(分段计费)
场景:14:40–15:40 期间,于 15:10 从标准版升配至旗舰版(2 RCU)。标准版和旗舰版运行时长均为 30 分钟(即 0.50 小时,保留2位小数)。
规格费用(14:40-15:40期间):
标准版:0.50 小时 × 0.03 元/小时 = 0.015 元
旗舰版:0.50 小时 × 2 RCU × 0.2 元/RCU/小时 = 0.20 元
合计:0.215 元
3.4 运行不足 1 小时
场景:1 个标准版知识库,于 14:12 创建,并于 14:21 删除,总运行时长为 9 分钟(0.15 小时,保留2位小数)。
规格费用(14:12-14:21期间):0.15 小时 × 0.03 元/小时 = 0.0045 元
4. 费用与账单
4.1 查看账单与用量
4.1.1 查询知识库的规格费用
在账单详情页面中导出,可在账单(按小时聚合)中查看指定知识库在对应时段的规格费用(目录总价列)。
图中实例 ID 即知识库ID。

4.1.2 查询明细账单的Token消耗量与对应金额
在账单详情页面中导出,可在账单(按小时聚合)中查看对应时段的 Token 用量(用量列)与对应金额(目录总价列)。
查看向量模型的用量
将鼠标悬停在账单的实例ID上方:如果实例ID形如llm-xxx;xxx-embedding-xxx;embedding_token;RAG;0,表示该账单由向量模型产生。

查看排序模型的用量
将鼠标悬停在账单的实例ID上方:如果实例ID形如llm-xxx;xxx-rerank;embedding_token;RAG;0,表示该账单由排序模型产生。

4.2 成本分摊
4.3 欠费
阿里云账户欠费后,其所有知识库将会进入暂停服务状态(无法通过控制台或 API 检索、更新或创建知识库),并停止计费。
向量存储使用平台存储:
0–14 天:无法通过控制台或 API 检索、更新或创建知识库,但保留已有数据。在前 14 天内补缴所有欠费账单后,将自动恢复正常。
≥15 天:欠费后第 15 天,视为主动放弃知识库后付费服务。阿里云百炼将会释放相关知识库并永久删除其数据,无法恢复。
向量存储使用自购 ADB-PG:
0-7天: 无法通过控制台或 API 检索、更新或创建知识库,但保留已有数据。在前 7 天内补缴所有欠费账单后,将自动恢复正常。
≥8 天:欠费后第 8 天,视为主动放弃 ADB-PG 后付费服务。ADB-PG 将会清理知识库相关实例并永久删除其数据,无法恢复。详见ADB-PG欠费说明。
说明使用自购 ADB-PG 时,数据保留期遵循 ADB-PG 的欠费策略,为 7 天(非 14 天)。
4.4 退款
按量付费会根据知识库的规格,按实际使用时长产生账单,因此不涉及退款。
5. 常见问题
子账号可以开通知识库或查看账单吗?
不可以。知识库服务必须由阿里云主账号开通,所有费用也归属于主账号。主账号开通服务后,可以授权子账号使用已创建的知识库,但子账号无法独立查看详细账单。相关权限配置请参见权限管理。
标准版和旗舰版的“存储免费”具体指什么?
仅指平台向存储免费。自购 ADB-PG 由 ADB-PG 服务计费,不包含在知识库账单内。
知识库数据量很大,旗舰版的平台存储不够用怎么办?
您可以在创建知识库时,选择使用您自购的 ADB-PG 实例作为向量存储。具体配置方法请参见创建知识库章节。
配置变更跨小时如何计费?
按变更发生时间分段计费,同一小时内按各时间段占比累加。示例请参见配置变更(分段计费)。
为什么我的排序(Rerank)费用特别高?如何降低模型调用费用?
排序(Rerank)模型的费用与您最终返回的结果数量无关,而是由初步召回的文本切片总数决定的。降低模型调用费用详见本文2.2.3 费用优化建议内容。
如何彻底停止知识库的计费?删除库内文件可以吗?
不可以。停止计费的唯一方法是删除整个知识库实例。
错误操作:仅删除知识库内的文件,只是清除了数据,但知识库实例(作为计费主体)仍在运行,因此规格费用会持续产生。
正确操作:在控制台找到对应的知识库实例,并执行删除操作。
重要删除操作会永久清除知识库内的数据且无法恢复,请谨慎操作。
为什么排序模型调用次数会多于应用调用次数?
这是系统为提升性能进行的自动优化。当送入排序模型的单次请求包含大量切片时,系统会将其拆分为多个批次(Batch)来调用排序模型,以加快处理速度。
这会使排序模型的调用次数记录增加,但总费用不变,因为计费只与总Token消耗量相关,与调用次数无关。

