本文介绍阿里云百炼平台的模型训练、模型部署的计费规则及价格。
模型训练计费
文本生成模型-千问
模型训练流程请参见模型调优。训练完成后的新模型需先完成模型部署,才能评测和调用。
计费方式 | 按训练Token计费 |
计费公式 | 模型训练费用 = (训练数据 Token 总数 + 混合训练数据 Token 总数)× 循环次数 × 训练单价(最小计费单位:1 token) 您可以查看模型训练控制台底部的预估训练费用,并单击计算详情,查看训练 Token 总数、循环次数和训练单价。 |
千问
模型服务 | 模型代码 | 价格 |
Qwen3.6-Flash-2026-04-16 | qwen3.6-flash-2026-04-16 | ¥0.05/千Token |
Qwen3.5-27B | qwen3.5-27b | ¥0.05/千Token |
Qwen3.5-9B | qwen3.5-9b | ¥0.02/千Token |
Qwen3.5-Flash-2026-02-23 | qwen3.5-flash-2026-02-23 | ¥0.05/千Token |
Qwen3-32B | qwen3-32b | ¥0.04/千Token |
Qwen3-30B-A3B-Instruct-2507 | qwen3-30b-a3b-instruct-2507 | ¥0.03/千Token |
Qwen3-14B | qwen3-14b | ¥0.03/千Token |
Qwen3-8B | qwen3-8b | ¥0.006/千Token |
Qwen3-1.7B | qwen3-1.7b | ¥0.0045/千Token |
Qwen3-0.6B | qwen3-0.6b | ¥0.003/千Token |
Qwen2.5-72B-Instruct | qwen2.5-72b-instruct | ¥0.15/千Token |
Qwen2.5-32B-Instruct | qwen2.5-32b-instruct | ¥0.03/千Token |
Qwen2.5-14B-Instruct | qwen2.5-14b-instruct | ¥0.03/千Token |
Qwen2.5-7B-Instruct | qwen2.5-7b-instruct | ¥0.006/千Token |
千问-Plus-Character-2025-11-06 | qwen-plus-character-2025-11-06 | ¥0.15/千Token |
千问VL
模型服务 | 模型代码 | 价格 |
Qwen3-VL-8B-Instruct | qwen3-vl-8b-instruct | ¥0.012/千Token |
Qwen3-VL-8B-Thinking | qwen3-vl-8b-thinking | ¥0.012/千Token |
Qwen3-VL-4B-Instruct | qwen3-vl-4b-instruct | ¥0.006/千Token |
Qwen2.5-VL-72B-Instruct | qwen2.5-vl-72b-instruct | ¥0.05/千Token |
Qwen2.5-VL-32B-Instruct | qwen2.5-vl-32b-instruct | ¥0.02/千Token |
Qwen2.5-VL-7B-Instruct | qwen2.5-vl-7b-instruct | ¥0.01/千Token |
图像生成模型-万相
模型训练流程请参见图像生成模型调优。训练完成后的新模型需先完成模型部署,才能调用。
计费方式 | 按训练Token计费 |
计费公式 | 模型训练费用 = 训练Token总量 × 训练单价(计费单位:每千Token) |
模型服务 | 模型名称 | 训练价格(每千Token) |
万相-图像生成 | wan2.7-image-pro | 0.08元 |
视频生成模型-万相
模型训练流程请参见模型调优。训练完成后的新模型需先完成模型部署,才能调用。
计费方式 | 按训练Token计费 |
计费公式 | 模型训练费用 = 训练Token总量 × 训练单价(计费单位:每千Token) |
模型服务 | 模型名称 | 训练价格(每千Token) |
万相-图生视频-基于首帧 | wan2.2-i2v-flash | 0.06元 |
wan2.5-i2v-preview | 0.32元 | |
图生视频-基于首尾帧 | wan2.2-kf2v-flash | 0.06元 |
模型部署计费
文本生成模型-千问
按使用时长计费(预置吞吐)
费用 = 使用时长 × (输入 TPM 单价 × 输入 TPM + 输出 TPM 单价 × 输出 TPM)
后付费按小时计算:使用时长单位为小时,单价取下表"持续 1 小时"列;预付费按天计算:使用时长单位为天,单价取下表"持续 1 天"列。
预付费订单支付后实时生效,有效期 N 天至第 N 天 23:59 结束。若在 22:00 后下单,到期日将自动顺延1天。
预付费订单到期后,将延后2小时停止服务,停止后资源保留14小时后释放。
预付费订单无法提前终止服务。
后付费时,如果账户欠费,部署的资源将保留并继续计费 24 小时,之后自动释放资源。
当模型输入超过最长输入 Token 或 超出购买的 TPM 量时,相关调用将自动切换为当前模型的按量付费模式。此时,推理性能可能下降,限流将受业务空间中当前快照模型的公共流量的管控,费用按模型调用(按量付费)标准计收。
此时,调用 API 返回 Header 将包含:
x-dashscope-ptu-overflow:true。TPM 统计请前往:模型监控(北京)。
缩容场景(降配)的具体降费退费规则请参考:降配退款规则说明。
千问
模型名称 | 模型代码 | 最长输入Token | 后付费输入 Per 10K TPM/小时 | 后付费输出 Per 1K TPM/小时 | 预付费输入 Per 10K TPM/天 | 预付费输出 Per 1K TPM/天 |
千问3.7-Max-2026-05-20 | qwen3.7-max-2026-05-20 | 128,000 | ¥28.8 | ¥8.64 | ¥345.6 | ¥103.68 |
千问3.6-Flash-2026-04-16 | qwen3.6-flash-2026-04-16 | 128,000 | ¥2.88 | ¥1.73 | ¥34.56 | ¥20.74 |
千问3.6-Plus-2026-04-02 | qwen3.6-plus-2026-04-02 | 128,000 | ¥4.8 | ¥2.88 | ¥57.6 | ¥34.56 |
千问3.5-Plus-2026-04-20 | qwen3.5-plus-2026-04-20 | 128,000 | ¥1.92 | ¥1.15 | ¥23.04 | ¥13.82 |
千问3-Max-2025-09-23 | qwen3-max-2025-09-23 | 128,000 | ¥7.68 | ¥3.08 | ¥92.16 | ¥36.96 |
千问-Flash-2025-07-28 | qwen-flash-2025-07-28 | 128,000 | ¥0.36 | ¥0.36 | ¥4.32 | ¥4.32 |
千问-Plus-2025-12-01 | qwen-plus-2025-12-01 | 128,000 | ¥1.92 | 非思考:¥0.48 思考:¥1.92 | ¥23.04 | 非思考:¥5.76 思考:¥23.04 |
DeepSeek
模型名称 | 模型代码 | 最长输入Token | 后付费输入 Per 10K TPM/小时 | 后付费输出 Per 1K TPM/小时 | 预付费输入 Per 10K TPM/天 | 预付费输出 Per 1K TPM/天 |
DeepSeek-v4-Pro | deepseek-v4-pro | 64,000 | ¥43.2 | ¥8.64 | ¥518.4 | ¥103.68 |
DeepSeek-v3.2 | deepseek-v3.2 | 64,000 | ¥7.2 | ¥1.08 | ¥86.4 | ¥12.96 |
DeepSeek-v3 | deepseek-v3 | 64,000 | ¥7.2 | ¥2.88 | ¥86.4 | ¥34.56 |
千问VL
模型名称 | 模型代码 | 最长输入Token | 后付费输入 Per 10K TPM/小时 | 后付费输出 Per 1K TPM/小时 | 预付费输入 Per 10K TPM/天 | 预付费输出 Per 1K TPM/天 |
千问3-VL-Plus-2025-09-23 | qwen3-vl-plus-2025-09-23 | 128,000 | ¥2.4 | ¥2.4 | ¥28.8 | ¥28.8 |
更多模型
模型名称 | 模型代码 | 最长输入Token | 后付费输入 Per 10K TPM/小时 | 后付费输出 Per 1K TPM/小时 | 预付费输入 Per 10K TPM/天 | 预付费输出 Per 1K TPM/天 |
GLM-5.1 | glm-5.1 | 64,000 | ¥21.6 | ¥8.64 | ¥259.2 | ¥103.68 |
按使用时长计费(模型单元)
费用 = 使用时长(小时)× 模型单元数量 × 模型单元单价
"模型单元单价"在后付费场景下取下表"小时单价"列;预付费按月计费时,公式改为 包月数 × 模型单元数量 × 月单价。
预付费购买的首月,如在首月内提前退订,日单价(≈ 月单价 / 30)将按 1.2 倍计费(不满一天按一天计费)
模型单元-后付费方式的算力资源先买到先得。如购买不成功会全额退款。
文本生成
千问
模型名称 | 模型代码 | 模型单元规格 | 小时单价(元) | 包月单价(元) |
千问3.6-35B-A3B | qwen3.6-35b-a3b | MU8 x 1 | ¥47 | ¥22,400 |
MU9 x 1 | ¥51 | ¥24,600 | ||
千问3.6-27B | qwen3.6-27b | MU9 x 1 | ¥51 | ¥24,600 |
千问3.6-Flash-2026-04-16 | qwen3.6-flash-2026-04-16 | MU1 x 2 | ¥108 | ¥52,236 |
千问3.6-Plus-2026-04-02 | qwen3.6-plus-2026-04-02 | MU1 x 8 MU1 x 16(PD分离模式) | ¥432 PD分离模式:¥864 | ¥208,944 PD分离模式:¥417,888 |
千问3.5-397B-A17B | qwen3.5-397b-a17b | MU2 x 8 | ¥504 | ¥240,288 |
MU3 x 8 MU3 x 16(PD分离模式) | ¥1,096 PD分离模式:¥2,192 | ¥527,752 PD分离模式:¥1,055,504 | ||
MU6 x 16 | ¥400 | ¥193,424 | ||
千问3.5-122B-A10B | qwen3.5-122b-a10b | MU1 x 4 | ¥216 | ¥104,472 |
MU2 x 8 | ¥504 | ¥240,288 | ||
MU6 x 16 | ¥400 | ¥193,424 | ||
MU9 x 2 | ¥102 | ¥49,200 | ||
千问3.5-35B-A3B | qwen3.5-35b-a3b | MU1 x 2 | ¥108 | ¥52,236 |
MU2 x 8 | ¥504 | ¥240,288 | ||
MU8 x 1 | ¥47 | ¥22,400 | ||
MU9 x 1 | ¥51 | ¥24,600 | ||
千问3.5-27B | qwen3.5-27b | MU1 x 2 | ¥108 | ¥52,236 |
MU9 x 1 | ¥51 | ¥24,600 | ||
千问3.5-9B | qwen3.5-9b | MU1 x 2 | ¥108 | ¥52,236 |
MU8 x 1 | ¥47 | ¥22,400 | ||
MU9 x 1 | ¥51 | ¥24,600 | ||
千问3.5-Flash-2026-02-23 | qwen3.5-flash-2026-02-23 | MU1 x 2 | ¥108 | ¥52,236 |
MU8 x 1(模型压缩) | ¥47 | ¥22,400 | ||
千问3.5-Plus-2026-02-15 | qwen3.5-plus-2026-02-15 | MU1 x 16(PD分离模式) | PD分离模式:¥864 | PD分离模式:¥417,888 |
MU3 x 8 MU3 x 16(PD分离模式) | ¥1,096 PD分离模式:¥2,192 | ¥527,752 | ||
千问3-235B-A22B-Instruct-2507 | qwen3-235b-a22b-instruct-2507 | MU1 x 4 | ¥216 | ¥104,472 |
MU2 x 8 | ¥504 | ¥240,288 | ||
千问3-Next-80B-A3B-Instruct | qwen3-next-80b-a3b-instruct | MU1 x 2 | ¥108 | ¥52,236 |
千问3-32B | qwen3-32b | MU1 x 4 | ¥216 | ¥104,472 |
MU6 x 4 | ¥100 | ¥48,356 | ||
千问3-30B-A3B | qwen3-30b-a3b | MU9 x 2 | ¥102 | ¥49,200 |
千问3-30B-A3B-Instruct-2507 | qwen3-30b-a3b-instruct-2507 | MU1 x 4 | ¥216 | ¥104,472 |
MU2 x 8 | ¥504 | ¥240,288 | ||
千问3-8B | qwen3-8b | MU1 x 2 | ¥108 | ¥52,236 |
MU2 x 2 | ¥126 | ¥60,072 | ||
MU5 x 1 | ¥21 | ¥10,139 | ||
千问3-4B | qwen3-4b | MU1 x 2 | ¥108 | ¥52,236 |
MU5 x 1 | ¥21 | ¥10,139 | ||
千问3-1.7B | qwen3-1.7b | MU1 x 2 | ¥108 | ¥52,236 |
MU5 x 1 | ¥21 | ¥10,139 | ||
千问3-Embedding-0.6B | qwen3-embedding-0.6b | MU5 x 1 | ¥21 | ¥10,139 |
MU6 x 1 | ¥25 | ¥12,089 | ||
千问3-MoE-Rerank-0.6B | qwen3-moe-rerank-0.6b | MU5 x 1 | ¥21 | ¥10,139 |
千问3-Rerank-0.6B | qwen3-rerank-0.6b | MU5 x 1 | ¥21 | ¥10,139 |
MU6 x 1 | ¥25 | ¥12,089 | ||
千问3-Max-2025-09-23 | qwen3-max-2025-09-23 | MU2 x 8 | ¥504 | ¥240,288 |
MU3 x 8 | ¥1,096 | ¥527,752 | ||
千问3-Rerank | qwen3-rerank | MU5 x 1 | ¥21 | ¥10,139 |
千问2.5-开源版-72B | qwen2.5-72b-instruct | MU1 x 4 | ¥216 | ¥104,472 |
千问2.5-开源版-32B | qwen2.5-32b-instruct | MU1 x 4 | ¥216 | ¥104,472 |
千问2.5-开源版-14B | qwen2.5-14b-instruct | MU1 x 2 | ¥108 | ¥52,236 |
千问2.5-开源版-7B | qwen2.5-7b-instruct | MU1 x 2 | ¥108 | ¥52,236 |
MU5 x 1 | ¥21 | ¥10,139 | ||
千问2.5-开源版-3B | qwen2.5-3b-instruct | MU5 x 1 | ¥21 | ¥10,139 |
千问-Flash-2025-07-28 | qwen-flash-2025-07-28 | MU1 x 4 | ¥216 | ¥104,472 |
千问-Plus-2025-07-28 | qwen-plus-2025-07-28 | MU1 x 4 MU1 x 16(PD分离模式) | ¥216 PD分离模式:¥864 | ¥104,472 PD分离模式:¥417,888 |
千问-Plus-2025-12-01 | qwen-plus-2025-12-01 | MU1 x 4 | ¥216 | ¥104,472 |
GLM
模型名称 | 模型代码 | 模型单元规格 | 小时单价(元) | 包月单价(元) |
GLM-5 | glm-5 | MU3 x 16(PD分离模式) | PD分离模式:¥2,192 | PD分离模式:¥1,055,504 |
GLM-4.7 | glm-4.7 | MU6 x 32(PD分离模式) | PD分离模式:¥800 | PD分离模式:¥386,848 |
DeepSeek
模型名称 | 模型代码 | 模型单元规格 | 小时单价(元) | 包月单价(元) |
DeepSeek-v4-Flash | deepseek-v4-flash | MU1 x 8 | ¥432 | ¥208,944 |
DeepSeek-v3.2 | deepseek-v3.2 | MU2 x 16(PD分离模式) | PD分离模式:¥1,008 | PD分离模式:¥480,576 |
更多模型
模型名称 | 模型代码 | 模型单元规格 | 小时单价(元) | 包月单价(元) |
MiniMax-M2.5 | MiniMax-M2.5 | MU1 x 16(PD分离模式) | PD分离模式:¥864 | PD分离模式:¥417,888 |
Kimi-K2.5 | kimi-k2.5 | MU2 x 8 | ¥504 | ¥240,288 |
模型类型:
Instruct - 模型部署后以非思考模式进行推理。
Thinking - 模型部署后以思考模式进行推理。
模型部署类型:
PD 分离模式 - 降低首 Token 延迟、提高吞吐。
该部署模式部署的模型在进行模型推理时,将首 Token 计算(Prefill)和后续 Token 计算(Decode)两个计算阶段,拆到不同的计算节点执行。
多模态
千问VL
模型名称 | 模型代码 | 模型单元规格 | 小时单价(元) | 包月单价(元) |
千问3-VL-235B-A22B-Instruct | qwen3-vl-235b-a22b-instruct | MU1 x 4 | ¥216 | ¥104,472 |
千问3-VL-235B-A22B-Thinking | qwen3-vl-235b-a22b-thinking | MU1 x 4 | ¥216 | ¥104,472 |
千问3-VL-32B-Instruct | qwen3-vl-32b-instruct | MU2 x 8 | ¥504 | ¥240,288 |
千问3-VL-8B-Instruct | qwen3-vl-8b-instruct | MU1 x 2 | ¥108 | ¥52,236 |
千问3-VL-4B-Instruct | qwen3-vl-4b-instruct | MU1 x 2 | ¥108 | ¥52,236 |
千问3-VL-2B-Instruct | qwen3-vl-2b-instruct | MU5 x 1 | ¥21 | ¥10,139 |
千问3-VL-Embedding-2B | qwen3-vl-embedding-2b | MU5 x 1 | ¥21 | ¥10,139 |
千问3-VL-Flash-2025-10-15 | qwen3-vl-flash-2025-10-15 | MU1 x 4 | ¥216 | ¥104,472 |
千问3-VL-Plus-2025-09-23 | qwen3-vl-plus-2025-09-23 | MU1 x 4 | ¥216 | ¥104,472 |
千问VL-Max-2025-08-13 | qwen-vl-max-2025-08-13 | MU6 x 4 | ¥100 | ¥48,356 |
千问VL-OCR-2025-11-20 | qwen-vl-ocr-2025-11-20 | MU6 x 4 | ¥100 | ¥48,356 |
千问 Omni
模型名称 | 模型代码 | 模型单元规格 | 小时单价(元) | 包月单价(元) |
千问3.5-Omni-Flash | qwen3.5-omni-flash | MU8 x 1 | ¥47 | ¥22,400 |
MU9 x 1 | ¥51 | ¥24,600 | ||
千问3.5-Omni-Plus | qwen3.5-omni-plus | MU9 x 8 | ¥408 | ¥196,800 |
模型类型:
Instruct - 模型部署后以非思考模式进行推理。
Thinking - 模型部署后以思考模式进行推理。
Instruct/Thinking - 可在模型部署时选择是否开启思考模式。
语音合成
CosyVoice
模型名称 | 模型代码 | 模型单元规格 | 小时单价(元) | 包月单价(元) |
cosyvoice-v3-flash | cosyvoice-v3-flash | MU5 | ¥21 | ¥10,139 |
按模型 Token 使用量
费用 = 模型输入 Token 数 × 模型输入单价 + 模型输出 Token 数 × 模型输出单价(最小计费单位:1 token)
仅当对下列基础模型完成 SFT 高效训练并得到自定义模型后,才支持按模型 Token 使用量计费。
千问
基础模型 | 模型代码 | 输入 元/千Token | 输出 元/千Token |
千问3-32B | qwen3-32b | ¥0.002 | 非思考模式:¥0.008 思考模式:¥0.02 |
千问3-14B | qwen3-14b | ¥0.001 | 非思考模式:¥0.004 思考模式:¥0.01 |
千问3-8B | qwen3-8b | ¥0.0005 | 非思考模式:¥0.002 思考模式:¥0.005 |
千问2.5-开源版-72B | qwen2.5-72b-instruct | ¥0.004 | ¥0.012 |
千问2.5-开源版-32B | qwen2.5-32b-instruct | ¥0.002 | ¥0.006 |
千问2.5-开源版-14B | qwen2.5-14b-instruct | ¥0.001 | ¥0.003 |
千问2.5-开源版-7B | qwen2.5-7b-instruct | ¥0.0005 | ¥0.001 |
千问VL
基础模型 | 模型代码 | 输入 元/千Token | 输出 元/千Token |
千问3-VL-8B-Instruct | qwen3-vl-8b-instruct | ¥0.0005 | ¥0.002 |
千问2.5-VL-72B | qwen2.5-vl-72b-instruct | ¥0.016 | ¥0.048 |
千问2.5-VL-32B | qwen2.5-vl-32b-instruct | ¥0.008 | ¥0.024 |
千问2.5-VL-7B | qwen2.5-vl-7b-instruct | ¥0.002 | ¥0.005 |
图像生成模型-万相
经过SFT-LoRA高效微调的万相图像生成模型,调用按微调的基础模型的标准调用价格计费。模型训练和部署流程请参见图像生成模型调优。
模型名称 | 部署价格 | 调用价格 |
wan2.7-image-pro | 免费 | 0.50元/张 |
常见问题
Q:模型部署什么时候开始计费?
A:当模型完成部署,即状态为运行中时,开始收取模型部署的费用。模型状态为部署中、欠费、部署失败时,均不会计费。
如果是包月预付费,模型状态为运行中后,开始消耗包月时间。
Q:取消模型训练会收费么?
A:会收费。如果您主动取消训练,之前已产生的费用仍会被计算。其他原因导致的训练中断,阿里云百炼不会向您收取训练费用。
Q:怎么查看已部署模型的调用统计?
A:请访问模型监控(北京)、模型监控(弗吉尼亚)、模型监控(新加坡)页面。
模型监控页面支持按时间范围(今天、昨天、近3天、近七天、近15天)和推理类型筛选,上方汇总区展示模型总量、总调用次数、总失败次数、平均调用时长、平均首包时长,下方模型列表展示各模型的调用总量、调用失败量、失败率、平均调用时长、平均首Token延时等指标,可单击监控查看单模型详细数据。