本文介绍阿里云百炼平台的模型训练、模型部署的计费规则及价格。
模型训练计费
文本生成模型-千问
模型训练流程请参见模型调优。训练完成后的新模型需先完成模型部署,才能评测和调用。
|
计费方式 |
按训练Token计费 |
|
计费公式 |
模型训练费用 = (训练数据 Token 总数 + 混合训练数据 Token 总数)× 循环次数 × 训练单价(最小计费单位:1 token) 您可以查看模型训练控制台底部的预估训练费用,并单击计算详情,查看训练 Token 总数、循环次数和训练单价。 |
千问
模型服务 | 模型规格 | 价格 |
千问2.5-72B | qwen2.5-72b-instruct | 0.15元/千Token |
Qwen-Plus-character-2025-11-06 | qwen-plus-character-2025-11-06 | |
千问3-32B | qwen3-32b | 0.04 元/千Token |
千问3-32B-Base | qwen3-32b-base | |
千问3-30B-A3B-Instruct-2507 | qwen3-30b-a3b-instruct-2507 | 0.03元/千 Token |
千问3-14B | qwen3-14b | |
千问3-14B-Base | qwen3-14b-base | |
千问2.5-32B | qwen2.5-32b-instruct | |
千问2.5-14B | qwen2.5-14b-instruct | |
千问3-8B | qwen3-8b | 0.006元/千 Token |
千问3-8B-Base | qwen3-8b-base | |
千问3-4B-Instruct-2507 | qwen3-4b-instruct-2507 | |
千问3-4B-Base-2507 | qwen3-4b-base-2507 | |
千问3-VL-4B-Instruct | qwen3-vl-4b-instruct | |
千问2.5-7B | qwen2.5-7b-instruct | |
千问3-1.7B | qwen3-1.7b | 0.0045元/千Token |
千问3-0.6B | qwen3-0.6b | 0.003元/千Token |
千问VL
模型服务 | 模型规格 | 价格 |
千问2.5-VL-72B | qwen2.5-vl-72b-instruct | 0.05 元/千Token |
千问2.5-VL-32B | qwen2.5-vl-32b-instruct | 0.02 元/千Token |
千问3-VL-8B-Instruct | qwen3-vl-8b-instruct | 0.012元/千Token |
千问3-VL-8B-Thinking | qwen3-vl-8b-thinking | |
千问3-VL-8B-Base | qwen3-vl-8b-base | |
千问2.5-VL-7B | qwen2.5-vl-7b-instruct | 0.01 元/千Token |
千问3-VL-1B-Base | qwen3-vl-1b-base | 0.003元/千Token |
视频生成模型-万相
模型训练流程请参见模型调优。训练完成后的新模型需先完成模型部署,才能调用。
|
计费方式 |
按训练Token计费 |
|
计费公式 |
模型训练费用 = 训练Token总量 × 训练单价(计费单位:每千Token) |
|
模型服务 |
模型名称 |
训练价格(每千Token) |
|
万相-图生视频-基于首帧 |
wan2.2-i2v-flash |
0.06元 |
|
wan2.5-i2v-preview |
0.32元 |
|
|
图生视频-基于首尾帧 |
wan2.2-kf2v-flash |
0.06元 |
模型部署计费
文本生成模型-千问
按使用时长计费(预置吞吐)
费用 = 使用时长 × (输入 TPM 单价 × 输入 TPM + 输出 TPM 单价 × 输出 TPM)
预付费订单支付后实时生效,有效期 N 天至第 N 天 23:59 结束。若在 22:00 后下单,到期日将自动顺延1天。
预付费订单到期后,将延后2小时停止服务,停止后资源保留14小时后释放。
预付费订单无法提前终止服务。
后付费时,如果账户欠费,部署的资源将保留并继续计费 24 小时,之后自动释放资源。
当模型输入超过最长输入 Token 或 超出购买的 TPM 量时,相关调用将自动切换为当前模型的按量付费模式。此时,推理性能可能下降,限流将受业务空间中当前快照模型的公共流量的管控,费用按模型调用(按量付费)标准计收。
此时,调用 API 返回 Header 将包含:
x-dashscope-ptu-overflow:true。TPM 统计请前往:模型监控(北京)。
模型名称 | 模型类型 | 最长输入 Token限制 | 后付费-按小时 | 预付费-按天 | ||
输入(Per 10k TPM) | 输出(Per 1k TPM) | 输入(Per 10k TPM) | 输出(Per 1k TPM) | |||
千问3.6-Plus-2026-04-02 | Instruct | 128,000 | ¥4.8 | ¥2.88 | ¥57.6 | ¥34.56 |
千问3-max-2025-09-23 | Instruct | 128,000 | ¥7.68 | ¥3.08 | ¥92.16 | ¥36.96 |
千问-plus-2025-12-01 | Instruct | ¥1.92 | ¥0.48 | ¥23.04 | ¥5.76 | |
Thinking | ¥1.92 | ¥23.04 | ||||
千问-flash-2025-07-28 | Instruct | ¥0.36 | ¥0.36 | ¥4.32 | ¥4.32 | |
千问3-vl-plus-2025-09-23 | Instruct | ¥2.40 | ¥2.40 | ¥28.80 | ¥28.80 | |
DeepSeek-v3.2 | Instruct | 64,000 | ¥7.20 | ¥1.08 | ¥86.40 | ¥12.96 |
模型类型:
Instruct - 模型部署后以非思考模式进行推理。
Thinking - 模型部署后以思考模式进行推理。
按使用时长计费(模型单元)
费用 = 使用时长(小时)× 模型单元数量 × 模型单元单价
预付费购买的首月,如在首月内提前退订,日单价将按 1.2 倍计费
模型单元-后付费方式的算力资源先买到先得。如购买不成功会全额退款。
千问
模型名称 | 模型类型 | 支持限流 | 模型单元规格 | 后付费-按小时 (不满 1 分钟按 1 分钟计费) | 预付费-按天 (不满 1 天按 1 天计费) |
千问3.6-Plus-2026-04-02 | Thinking | I 型模型单元(MU1) | ¥432/小时 | ¥208,944/月 | |
千问3.5-Plus-2026-02-15 | Instruct | III 型模型单元(MU3) | ¥1,048/小时 PD分离模式:¥2,096/小时 | ¥504,000/月 PD 分离模式:¥1,008,000/月 | |
Qwen2.5-14B-Instruct | Instruct | I 型模型单元(MU1) | ¥108/小时 | ¥52,236/月 | |
GLM-5 | Instruct | III 型模型单元(MU3) | ¥1,048/小时 PD分离模式:¥2,096/小时 | ¥504,000/月 PD 分离模式:¥1,008,000/月 | |
千问3.5-397B-A17B | Instruct | III 型模型单元(MU3) | ¥1,048/小时 PD分离模式:¥2,096/小时 | ¥504,000/月 PD 分离模式:¥1,008,000/月 | |
千问3-Max-2025-09-23 | Instruct | II 型 / III 型模型单元 (MU2/MU3) | II 型模型单元:¥504/小时 III 型模型单元:¥1,048/小时 | II 型模型单元:¥240,288/月 III 型模型单元:¥504,000/月 | |
DeepSeek-v3.2 | Instruct | II 型模型单元(MU2) | ¥504/小时 PD分离模式:¥896/小时 | ¥240,288/月 PD 分离模式:¥432,000/月 | |
千问3-235B-A22B-Instruct-2507 | Instruct | I / II 型模型单元 (MU1/MU2) | I 型模型单元:¥216/小时 II 型模型单元:¥448/小时 | I 型模型单元:¥104,472/月 II 型模型单元:¥216,000/月 | |
千问-Plus-2025-12-01 | Instruct/Thinking | I 型模型单元(MU1) | ¥216/小时 | ¥104,472/月 | |
千问-Plus-2025-07-28 | Instruct/Thinking | ||||
千问-Flash-2025-07-28 | Instruct/Thinking | ||||
千问2.5-开源版-72B | Instruct | ||||
千问2.5-开源版-32B | Instruct | ||||
千问3-32B | Instruct | ||||
qwen3.5-35b-a3b | Thinking | I 型模型单元(MU1) | ¥108/小时 | ¥52,236/月 | |
千问3.5-9B | Instruct | I 型模型单元(MU1) | ¥108/小时 | ¥52,236/月 | |
千问3.5-27B | Instruct | ||||
千问3-Next-80B-A3B-Instruct | Instruct | ||||
qwen3.5-122b-a10b | Thinking | I 型模型单元(MU1) | ¥216/小时 | ¥104,472/月 | |
千问3-4B | Instruct | V / I 型模型单元 (MU5/MU1) | V 型模型单元:¥20/小时 I 型模型单元:¥96/小时 | V 型模型单元:¥9,500/月 I 型模型单元:¥46,000/月 | |
千问3-1.7B | Instruct | V / I 型模型单元 (MU5/MU1) | V 型模型单元:¥20/小时 I 型模型单元:¥96/小时 | V 型模型单元:¥9,500/月 I 型模型单元:¥46,000/月 | |
Text Embedding V4 | Embedding | V 型模型单元(MU5) | ¥20/小时 | ¥9,500/月 | |
千问2.5-开源版-3B | Instruct | ||||
千问3-Rerank | Rerank | ||||
千问3-MoE-Rerank-0.6B | Rerank | ||||
千问3-Rerank-0.6B | Rerank | V / VI 型模型单元 (MU5/MU6) | V 型模型单元:¥20/小时 VI 型模型单元:¥18/小时 | V 型模型单元:¥9,500/月 VI 型模型单元:¥8,700/月 | |
千问3-Embedding-0.6B | Embedding | VI / V 型模型单元 (MU6/MU5) | ¥25/小时 V 型模型单元:¥20/小时 | ¥12,089/月 V 型模型单元:¥9,500/月 | |
MiniMax-M2.5 | Instruct | I 型模型单元(MU1) | ¥432/小时 | ¥208,944/月 | |
kimi-k2.5 | Thinking | II 型模型单元(MU2) | ¥504/小时 | ¥240,288/月 | |
模型类型:
Instruct - 模型部署后以非思考模式进行推理。
Thinking - 模型部署后以思考模式进行推理。
模型部署类型:
PD 分离模式 - 降低首 Token 延迟、提高吞吐。
该部署模式部署的模型在进行模型推理时,将首 Token 计算(Prefill)和后续 Token 计算(Decode)两个计算阶段,拆到不同的计算节点执行。
千问VL
模型服务 | 模型类型 | 支持限流 | 模型单元规格 | 单价 (不满 1 分钟按 1 分钟计费) | 包月单价 (不满 1 天按 1 天计费) (如在首月内提前退订,日单价将按 1.2 倍计费) |
千问VL-Max-2025-08-13 | Instruct | VI 型模型单元(MU6) | ¥100/小时 | ¥48,356/月 | |
千问VL-OCR-2025-11-20 | Instruct | VI 型模型单元(MU6) | |||
千问3-VL-8B-Instruct | Instruct | I 型模型单元(MU1) | ¥108/小时 ¥96/小时 | ¥52,236/月 ¥46,000/月 | |
千问3-VL-4B-Instruct | Instruct | ||||
千问3-VL-Flash-2025-10-15 | Instruct/Thinking | I 型模型单元(MU1) | ¥216/小时 | ¥104,472/月 | |
千问3-VL-Plus-2025-09-23 | Instruct/Thinking | ||||
千问3-VL-235B-A22B-Instruct | Instruct | ||||
千问3-VL-32B-Instruct | Instruct | ||||
千问3-VL-Embedding-2B | Embedding | V 型模型单元(MU5) | ¥20/小时 | ¥9,500/月 | |
qwen3-vl-2b-instruct | Thinking | V 型模型单元(MU5) | ¥20/小时 | ¥9,500/月 | |
模型类型:
Instruct - 模型部署后以非思考模式进行推理。
Thinking - 模型部署后以思考模式进行推理。
Instruct/Thinking - 可在模型部署时选择是否开启思考模式。
按模型 Token 使用量
费用 = 模型输入 Token 数 × 模型输入单价 + 模型输出 Token 数 × 模型输出单价(最小计费单位:1 token)
仅当对下列基础模型完成 SFT 高效训练并得到自定义模型后,才支持按模型 Token 使用量计费。
基础模型 | 模型类型 | 最长上下文 | 输入单价 | 输出单价 |
千问3-32B | Instruct | 固定为: | ¥0.002/千Token | 非思考模式:¥0.008/千Token 思考模式:¥0.02/千Token |
千问3-14B | Instruct | ¥0.001/千Token | 非思考模式:¥0.004/千Token 思考模式:¥0.01/千Token | |
千问3-8B | Instruct | ¥0.0005/千Token | 非思考模式:¥0.002/千Token 思考模式:¥0.005/千Token | |
千问3-VL-8B-Instruct | Instruct | 固定为: | ¥0.0005/千 Token | ¥0.002/千 Token |
千问 2.5-72B | Instruct | 固定为: | ¥0.004/千Token | ¥0.012/千Token |
千问 2.5-32B | Instruct | ¥0.002/千Token | ¥0.006/千Token | |
千问 2.5-14B | Instruct | ¥0.001/千Token | ¥0.003/千Token | |
千问 2.5-7B | Instruct | ¥0.0005/千Token | ¥0.001/千Token | |
千问2.5-VL-72B | Instruct | 固定为: | ¥0.016/千Token | ¥0.048/千Token |
千问2.5-VL-32B | Instruct | ¥0.008/千Token | ¥0.024/千Token | |
千问2.5-VL-7B | Instruct | ¥0.002/千Token | ¥0.005/千Token | |
千问 2-开源版-7B | Instruct | 固定为: | ¥0.001/千Token | ¥0.002/千Token |
图片、视频生成模型(预置)-按实例时长计费
费用 = 资源占用时长(小时)× 实例数量 × 实例单价(不满 1 小时按 1 小时计费)
图片生成
模型服务 | 模型类型 | 独占实例资源规格 | 后付费单价 | 预付费单价 (预付费) |
万相-文本生成图像-0521 | 预置模型 | 轻量版 | ¥20/实例/小时 | ¥10,000/月 |
视频生成
模型服务 | 模型类型 | 独占实例资源规格 | 后付费单价 | 预付费单价 (预付费) |
悦动人像EMO-detect | 预置模型 | 轻量版 | ¥20/实例/小时 | ¥10,000/月 |
悦动人像EMO | ||||
舞动人像AnimateAnyone-detect | ||||
舞动人像AnimateAnyone |
图像和视频生成模型(预置模型)
|
计费方式 |
计费公式 |
|
按实例资源占用时长计费 |
费用 = 资源占用时长(小时)× 实例数量 × 实例单价(不满1小时按1小时计费) 部署前可以在模型部署控制台查看不同模型的预估每小时费用。 |
|
实例包月计费/预付费 |
费用 = 购买时长(月)× 实例数量 × 模型对应的实例单价 购买资源:请前往模型部署控制台(单击右上角的资源池管理)购买。(资源购买完成后便开始计费) 退订资源:请前往主账号的退订管理退订。退订后,将根据未用时长退回未使用金额。(不满1天按1天计费) |
图片生成
模型服务 | 模型类型 | 独占实例资源规格 | 后付费单价 | 预付费单价 (预付费) |
万相-文本生成图像-0521 | 预置模型 | 轻量版 | ¥20/实例/小时 | ¥10,000/月 |
视频生成
模型服务 | 模型类型 | 独占实例资源规格 | 后付费单价 | 预付费单价 (预付费) |
悦动人像EMO-detect | 预置模型 | 轻量版 | ¥20/实例/小时 | ¥10,000/月 |
悦动人像EMO | ||||
舞动人像AnimateAnyone-detect | ||||
舞动人像AnimateAnyone |
常见问题
Q:模型部署什么时候开始计费?
A:当模型完成部署,即状态为运行中时,开始收取模型部署的费用。模型状态为部署中、欠费、部署失败时,均不会计费。
如果是包月预付费,模型状态为运行中后,开始消耗包月时间。
Q:取消模型训练会收费么?
A:会收费。如果您主动取消训练,之前已产生的费用仍会被计算。其他原因导致的训练中断,阿里云百炼不会向您收取训练费用。
Q:怎么查看已部署模型的调用统计?
A:请访问模型监控(北京)、模型监控(弗吉尼亚)、模型监控(新加坡)页面。
