本文介绍阿里云百炼平台的模型训练、模型部署的计费规则及价格。
模型训练计费
文本生成模型-千问
模型训练流程请参见模型调优。训练完成后的新模型需先完成模型部署,才能评测和调用。
|
计费方式 |
按训练Token计费 |
|
计费公式 |
模型训练费用 = (训练数据 Token 总数 + 混合训练数据 Token 总数)× 循环次数 × 训练单价(最小计费单位:1 token) 您可以查看模型训练控制台底部的预估训练费用,并单击计算详情,查看训练 Token 总数、循环次数和训练单价。 |
千问
|
模型服务 |
模型规格 |
价格 |
|
千问2.5-72B |
qwen2.5-72b-instruct |
0.15元/千Token |
|
千问2-开源版-72B |
qwen2-72b-instruct |
|
|
千问1.5-开源版-72B |
qwen1.5-72b-chat |
|
|
千问-Plus-0723 |
qwen-plus-0723 |
|
|
Qwen-Plus-character-2025-11-06 |
qwen-plus-character-2025-11-06 |
|
|
千问3-32B |
qwen3-32b |
0.04 元/千Token |
|
千问3-30B-A3B-Instruct-2507 |
qwen3-30b-a3b-instruct-2507 |
0.03元/千Token |
|
千问3-14B |
qwen3-14b |
|
|
千问3-VL-32B-Base |
qwen3-vl-32b-base |
|
|
千问2.5-32B |
qwen2.5-32b-instruct |
|
|
千问2.5-14B |
qwen2.5-14b-instruct |
|
|
千问1.5-开源版-14B |
qwen1.5-14b-chat |
|
|
千问-Plus |
qwen-plus |
|
|
千问Turbo |
qwen-turbo |
|
|
千问-Turbo-0624 |
qwen-turbo-0624 |
|
|
千问3-VL-8B-Base |
qwen3-vl-8b-base |
0.012元/千Token |
|
千问3-8B |
qwen3-8b |
0.006元/千Token |
|
千问3-4B-Instruct-2507 |
qwen3-4b-instruct-2507 |
|
|
千问3-4B-Base-2507 |
qwen3-4b-base-2507 |
|
|
千问3-VL-4B-Instruct |
qwen3-vl-4b-instruct |
|
|
千问2.5-7B |
qwen2.5-7b-instruct |
|
|
千问2-开源版-7B |
qwen2-7b-instruct |
|
|
千问1.5-开源版-7B |
qwen1.5-7b-chat |
|
|
千问3-1.7B |
qwen3-1.7b |
0.0045元/千Token |
|
千问3-0.6B |
qwen3-0.6b |
0.003元/千Token |
千问VL
|
模型服务 |
模型规格 |
价格 |
|
千问VL-Max-0201 |
qwen-vl-max-0201 |
0.15元/千Token |
|
千问VL-Plus |
qwen-vl-plus |
0.03元/千Token |
|
千问3-VL-8B-Instruct |
qwen3-vl-8b-instruct |
0.012元/千Token |
|
千问3-VL-8B-Thinking |
qwen3-vl-8b-thinking |
|
|
千问2.5-VL-72B |
qwen2.5-vl-72b-instruct |
0.05 元/千Token |
|
千问2.5-VL-32B |
qwen2.5-vl-32b-instruct |
0.02 元/千Token |
|
千问2.5-VL-7B |
qwen2.5-vl-7b-instruct |
0.01 元/千Token |
视频生成模型-万相
模型训练流程请参见模型调优。训练完成后的新模型需先完成模型部署,才能调用。
|
计费方式 |
按训练Token计费 |
|
计费公式 |
模型训练费用 = 训练Tokens总量 x 训练单价(计费单位:每千Token) |
|
模型服务 |
模型名称 |
训练价格(每千Token) |
|
万相-图生视频-基于首帧 |
wan2.2-i2v-flash |
0.06元 |
|
wan2.5-i2v-preview |
0.32元 |
|
|
图生视频-基于首尾帧 |
wan2.2-kf2v-flash |
0.06元 |
模型部署计费
文本生成模型-千问
方式一:按预置吞吐的使用时长计费
适用场景:追求稳定吞吐保障和高并发低延迟,且流量可预估的场景。
|
计费方式 |
计费公式 |
|
按使用时长和预置吞吐 |
费用 = 使用时长 × (输入 TPM 单价 × 输入 TPM + 输出 TPM 单价 × 输出 TPM) |
|
模型名称 |
模型类型 |
最长上下文 (输入 Token + 输出 Token) |
最长输入 Token |
后付费-按小时 |
预付费-按天 |
||
|
输入(Per 10k TPM) |
输出(Per 1k TPM) |
输入(Per 10k TPM) |
输出(Per 1k TPM) |
||||
|
千问3-max-2025-09-23 |
Instruct |
128,000 |
128,000 |
¥7.68 |
¥3.08 |
¥92.16 |
¥36.96 |
|
千问-plus-2025-12-01 |
Instruct |
¥1.92 |
¥0.48 |
¥23.04 |
¥5.76 |
||
|
Thinking |
¥1.92 |
¥23.04 |
|||||
|
千问-flash-2025-07-28 |
Instruct/Thinking |
¥0.36 |
¥0.36 |
¥4.32 |
¥4.32 |
||
|
千问3-vl-plus-2025-09-23 |
Instruct/Thinking |
¥2.40 |
¥2.40 |
¥28.80 |
¥28.80 |
||
|
DeepSeek-v3.2 |
Instruct/Thinking |
64,000 |
¥7.20 |
¥1.08 |
¥86.40 |
¥12.96 |
|
方式二:按模型单元的使用时长计费
适用场景:对并发要求较高、需要独占算力资源的场景。
模型单元是百炼平台提供的算力部署最小单位,按照使用时长收取资源费用。
|
计费方式 |
计费公式 |
|
按资源占用时长(后付费) |
费用 = 使用时长(小时)× 模型单元数量 × 模型单元单价(不满1分钟按1分钟计费) 部署前可以在模型部署控制台查看不同模型的预估每小时费用。 |
|
资源包月(预付费) |
费用 = 购买时长(月)× 模型单元数量 × 模型单元包月单价(不满1天按1天计费) 如果在开始使用的一个月内提前退订,日单价将为 1.2 倍,退订细节请参考非全额退款。 |
千问
|
模型名称 |
模型类型 |
支持限流 |
模型单元规格 |
最长上下文 |
后付费-按小时 (不满 1 分钟按 1 分钟计费) |
预付费-按天 (不满 1 天按 1 天计费) |
|
千问3-14B |
Instruct/Thinking |
|
I 型模型单元(MU1) |
固定为: 详情请参考:qwen-3 |
¥96/小时 |
¥46,000/月 |
|
千问3-8B |
Instruct/Thinking |
|
||||
|
千问2.5-开源版-14B |
Instruct |
|
固定为: 详情请参考:qwen-2.5 |
|||
|
千问2.5-开源版-7B |
Instruct |
|
||||
|
千问2-开源版-7B |
Instruct |
|
固定为: |
|||
|
千问-Turbo-0624(2024) |
Instruct |
|
固定为: |
|||
|
千问-Plus-2025-12-01 |
Instruct/Thinking |
|
I 型模型单元(MU1) |
可设置: 详情请参考:qwen-plus |
¥192/小时 |
¥92,000/月 |
|
千问-Plus-2025-07-28 |
Instruct/Thinking |
|
||||
|
千问-Flash-2025-07-28 |
Instruct/Thinking |
|
可设置: 详情请参考:qwen-flash |
|||
|
千问-Plus-0723(2024) |
Instruct |
|
固定为: |
|||
|
千问2.5-开源版-72B |
Instruct |
|
固定为: 详情请参考:qwen-2.5 |
|||
|
千问2.5-开源版-32B |
Instruct |
|
||||
|
千问2-开源版-72B |
Instruct |
|
固定为: |
|||
|
千问3-32B |
Instruct |
|
固定为: 详情请参考:qwen-3 |
|||
|
千问3-Max-2025-09-23 |
Instruct |
|
II 型 / III 型模型单元 (MU2/MU3) |
可设置: 详情请参考:qwen-max |
I 型模型单元:¥448/小时 III 型模型单元:¥1048/小时 |
I 型模型单元:¥216,000/月 III 型模型单元:¥504,000/月 |
模型类型:
-
Instruct - 模型部署后以非思考模式进行推理。
-
Thinking - 模型部署后以思考模式进行推理。
千问VL
|
模型服务 |
模型类型 |
支持限流 |
模型单元规格 |
最长上下文 |
单价 (不满 1 分钟按 1 分钟计费) |
包月单价 (不满 1 天按 1 天计费) (如在首月内提前退订,日单价将按 1.2 倍计费) |
|
千问VL-Max-2025-08-13 |
Instruct |
|
VI 型模型单元(MU6) |
固定为: |
¥72/小时 |
¥34,800/月 |
|
千问VL-Plus |
Instruct |
|
I 型模型单元(MU1) |
固定为: |
¥40/小时 |
¥20,000/月 |
|
千问3-VL-8B-Instruct |
Instruct |
|
I 型模型单元(MU1) |
固定为: |
¥96/小时 |
¥46,000/月 |
|
千问3-VL-8B-Thinking |
Thinking |
|
||||
|
千问3-VL-4B-Instruct |
Instruct |
|
||||
|
千问2.5-VL-7B |
Instruct |
|
||||
|
千问VL-Max-0201(2024) |
Instruct |
|
固定为: |
¥160/小时 |
¥80,000/月 |
|
|
千问3-VL-Flash-2025-10-15 |
Instruct/Thinking |
|
I 型模型单元(MU1) |
固定为: |
¥192/小时 |
¥92,000/月 |
|
千问3-VL-Plus-2025-09-23 |
Instruct/Thinking |
|
||||
|
千问3-VL-235B-A22B-Instruct |
Instruct |
|
固定为: |
|||
|
千问3-VL-32B-Instruct |
Instruct |
|
||||
|
千问2.5-VL-32B |
Instruct |
|
||||
|
千问2.5-VL-72B |
Instruct |
|
||||
模型类型:
-
Instruct - 模型部署后以非思考模式进行推理。
-
Thinking - 模型部署后以思考模式进行推理。
-
Instruct/Thinking - 可在模型部署时选择是否开启思考模式。
方式三:按模型 Token 调用量计费
适用场景:调用量波动大、希望低成本启动的场景。
按模型调用量计费方式价格很低。如果需要进一步增加并发量,需要部署后在模型部署控制台手动申请,平台会进行人工审批。
|
计费方式 |
计费公式 |
|
按模型调用量 |
费用 = 模型输入 Token 数 × 模型输入单价 + 模型输出 Token 数 × 模型输出单价(最小计费单位:1 token) |
控制台示例:

一个模型是可以在百炼的模型调优中进行重复训练的。
只有在基于以下基础模型进行“SFT高效训练”后获得的模型,才支持按调用量计费。
|
基础模型 |
模型类型 |
最长上下文 |
输入单价 |
输出单价 |
|
千问3-32B |
Instruct |
固定为: 详情请参考:qwen-3 |
¥0.002/千Token |
非思考模式:¥0.008/千Token 思考模式:¥0.02/千Token |
|
千问3-14B |
Instruct |
¥0.001/千Token |
非思考模式:¥0.004/千Token 思考模式:¥0.01/千Token |
|
|
千问3-8B |
Instruct |
¥0.0005/千Token |
非思考模式:¥0.002/千Token 思考模式:¥0.005/千Token |
|
|
千问 2.5-72B |
Instruct |
固定为: 详情请参考:qwen-2.5 |
¥0.004/千Token |
¥0.012/千Token |
|
千问 2.5-32B |
Instruct |
¥0.002/千Token |
¥0.006/千Token |
|
|
千问 2.5-14B |
Instruct |
¥0.001/千Token |
¥0.003/千Token |
|
|
千问 2.5-7B |
Instruct |
¥0.0005/千Token |
¥0.001/千Token |
|
|
千问2.5-VL-72B |
Instruct |
固定为: |
¥0.016/千Token |
¥0.048/千Token |
|
千问2.5-VL-32B |
Instruct |
¥0.008/千Token |
¥0.024/千Token |
|
|
千问2.5-VL-7B |
Instruct |
¥0.002/千Token |
¥0.005/千Token |
|
|
千问 2-开源版-7B |
Instruct |
固定为: |
¥0.001/千Token |
¥0.002/千Token |
方式四:按实例的使用时长计费(已停止购买)
图像和视频生成模型(预置模型)
|
计费方式 |
计费公式 |
|
按实例资源占用时长计费 |
费用 = 资源占用时长(小时)× 实例数量 × 实例单价(不满1小时按1小时计费) 部署前可以在模型部署控制台查看不同模型的预估每小时费用。 |
|
实例包月计费/预付费 |
费用 = 购买时长(月)× 实例数量 × 模型对应的实例单价 购买资源:请前往模型部署控制台(点击右上角的资源池管理)购买。(资源购买完成后便开始计费) 退订资源:请前往主账号的退订管理退订。退订后,将根据未用时长退回未使用金额。(不满1天按1天计费) |
图片生成
|
模型服务 |
模型类型 |
独占实例资源规格 |
后付费单价 |
预付费单价 (预付费) |
|
万相-文本生成图像-0521 |
预置模型 |
轻量版 |
¥20/实例/小时 |
¥10,000/月 |
视频生成
|
模型服务 |
模型类型 |
独占实例资源规格 |
后付费单价 |
预付费单价 (预付费) |
|
悦动人像EMO-detect |
预置模型 |
轻量版 |
¥20/实例/小时 |
¥10,000/月 |
|
悦动人像EMO |
||||
|
舞动人像AnimateAnyone-detect |
||||
|
舞动人像AnimateAnyone |
常见问题
Q:模型部署什么时候开始计费?
A:当模型完成部署,即状态为运行中时,开始收取模型部署的费用。模型状态为部署中、欠费、部署失败时,均不会计费。
如果是包月预付费,模型状态为运行中后,开始消耗包月时间。
Q:取消模型训练会收费么?
A:会收费。如果您主动取消训练,之前已产生的费用仍会被计算。其他原因导致的训练中断,阿里云百炼不会向您收取训练费用。
Q:怎么查看已部署模型的调用统计?
A:请访问模型监控(北京)、模型监控(弗吉尼亚)、模型监控(新加坡)页面。
