模型训练与部署计费

更新时间:
复制为 MD 格式

本文介绍阿里云百炼平台的模型训练、模型部署的计费规则及价格。

模型训练计费

文本生成模型-千问

说明

模型训练流程请参见模型调优。训练完成后的新模型需先完成模型部署,才能评测和调用。

计费方式

按训练Token计费

计费公式

模型训练费用 = (训练数据 Token 总数 + 混合训练数据 Token 总数)× 循环次数 × 训练单价(最小计费单位:1 token)

您可以查看模型训练控制台底部的预估训练费用,并单击计算详情,查看训练 Token 总数、循环次数和训练单价。

千问

模型服务

模型规格

价格

千问2.5-72B

qwen2.5-72b-instruct

0.15元/千Token

Qwen-Plus-character-2025-11-06

qwen-plus-character-2025-11-06

千问3-32B

qwen3-32b

0.04 元/千Token

千问3-32B-Base

qwen3-32b-base

千问3-30B-A3B-Instruct-2507

qwen3-30b-a3b-instruct-2507

0.03元/千 Token

千问3-14B

qwen3-14b

千问3-14B-Base

qwen3-14b-base

千问2.5-32B

qwen2.5-32b-instruct

千问2.5-14B

qwen2.5-14b-instruct

千问3-8B

qwen3-8b

0.006元/千 Token

千问3-8B-Base

qwen3-8b-base

千问3-4B-Instruct-2507

qwen3-4b-instruct-2507

千问3-4B-Base-2507

qwen3-4b-base-2507

千问3-VL-4B-Instruct

qwen3-vl-4b-instruct

千问2.5-7B

qwen2.5-7b-instruct

千问3-1.7B

qwen3-1.7b

0.0045元/千Token

千问3-0.6B

qwen3-0.6b

0.003元/千Token

千问VL

模型服务

模型规格

价格

千问2.5-VL-72B

qwen2.5-vl-72b-instruct

0.05 元/千Token

千问2.5-VL-32B

qwen2.5-vl-32b-instruct

0.02 元/千Token

千问3-VL-8B-Instruct

qwen3-vl-8b-instruct

0.012元/千Token

千问3-VL-8B-Thinking

qwen3-vl-8b-thinking

千问3-VL-8B-Base

qwen3-vl-8b-base

千问2.5-VL-7B

qwen2.5-vl-7b-instruct

0.01 元/千Token

千问3-VL-1B-Base

qwen3-vl-1b-base

0.003元/千Token

视频生成模型-万相

说明

模型训练流程请参见模型调优。训练完成后的新模型需先完成模型部署,才能调用。

计费方式

按训练Token计费

计费公式

模型训练费用 = 训练Token总量 × 训练单价(计费单位:每千Token)

训练Token总量的计算公式

其中:

  • N:训练集中的视频总数。

  • max_pixels:训练时指定的超参数,表示视频的最大像素数(创建微调任务时配置)。

  • n_epochs:训练时指定的超参数,表示循环次数(创建微调任务时配置)。

  • 单个视频计费时长计算规则:先将原始视频时长(秒)四舍五入取整,再根据模型限制取最终值。

    • wan2.5模型:计费时长=min(10, 四舍五入后的时长),即单条视频最多按 10 秒计算。

    • wan2.2模型:计费时长=min(5, 四舍五入后的时长),即单条视频最多按 5 秒计算。

模型服务

模型名称

训练价格(每千Token)

万相-图生视频-基于首帧

wan2.2-i2v-flash

0.06

wan2.5-i2v-preview

0.32

图生视频-基于首尾帧

wan2.2-kf2v-flash

0.06

计费示例

假设训练集包含 2 条视频,时长分别为 3.4 秒 和 6.5 秒,max_pixels = 262144,n_epochs = 400,训练单价 = 0.06元/千Token:

  • 时长计算:

    • 视频 1:3.4 → 四舍五入 → 3 秒 → 计费时长 = min(5, 3) = 3

    • 视频 2:6.5 → 四舍五入 → 7 秒 → 计费时长 = min(5, 7) = 5

    • 总计费时长 = 3 + 5 = 8 秒

  • 训练Token总量 = 8 ×(262144/1024)× 400 = 819200 = 819.2Token

  • 模型训练费用 = 819.2 × 0.06 = 49.152

模型部署计费

文本生成模型-千问

按使用时长计费(预置吞吐)

费用 = 使用时长 × (输入 TPM 单价 × 输入 TPM + 输出 TPM 单价 × 输出 TPM)

  • 预付费订单支付后实时生效,有效期 N 天至第 N 天 23:59 结束。若在 22:00 后下单,到期日将自动顺延1天。

  • 预付费订单到期后,将延后2小时停止服务,停止后资源保留14小时后释放。

  • 预付费订单无法提前终止服务。

  • 后付费时,如果账户欠费,部署的资源将保留并继续计费 24 小时,之后自动释放资源。

当模型输入超过最长输入 Token 或 超出购买的 TPM 量时,相关调用将自动切换为当前模型的按量付费模式。此时,推理性能可能下降,限流将受业务空间中当前快照模型的公共流量的管控,费用按模型调用(按量付费)标准计收。

  • 此时,调用 API 返回 Header 将包含:x-dashscope-ptu-overflow:true

  • TPM 统计请前往:模型监控(北京)

模型名称

模型类型

最长输入 Token限制

后付费-按小时

预付费-按天

输入(Per 10k TPM)

输出(Per 1k TPM)

输入(Per 10k TPM)

输出(Per 1k TPM)

千问3.6-Plus-2026-04-02

Instruct

128,000

¥4.8

¥2.88

¥57.6

¥34.56

千问3-max-2025-09-23

Instruct

128,000

¥7.68

¥3.08

¥92.16

¥36.96

千问-plus-2025-12-01

Instruct

¥1.92

¥0.48

¥23.04

¥5.76

Thinking

¥1.92

¥23.04

千问-flash-2025-07-28

Instruct

¥0.36

¥0.36

¥4.32

¥4.32

千问3-vl-plus-2025-09-23

Instruct

¥2.40

¥2.40

¥28.80

¥28.80

DeepSeek-v3.2

Instruct

64,000

¥7.20

¥1.08

¥86.40

¥12.96

模型类型:

  • Instruct - 模型部署后以非思考模式进行推理。

  • Thinking - 模型部署后以思考模式进行推理。

按使用时长计费(模型单元)

费用 = 使用时长(小时)× 模型单元数量 × 模型单元单价

  • 预付费购买的首月,如在首月内提前退订,日单价将按 1.2 倍计费

说明

模型单元-后付费方式的算力资源先买到先得。如购买不成功会全额退款。

千问

模型名称

模型类型

支持限流

模型单元规格

后付费-按小时

(不满 1 分钟按 1 分钟计费)

预付费-按天

(不满 1 天按 1 天计费)

千问3.6-Plus-2026-04-02

Thinking

支持

I 型模型单元(MU1)

¥432/小时

¥208,944/月

千问3.5-Plus-2026-02-15

Instruct

支持

III 型模型单元(MU3)

¥1,048/小时

PD分离模式:¥2,096/小时

¥504,000/月

PD 分离模式:¥1,008,000/月

Qwen2.5-14B-Instruct

Instruct

支持

I 型模型单元(MU1)

¥108/小时

¥52,236/月

GLM-5

Instruct

支持

III 型模型单元(MU3)

¥1,048/小时

PD分离模式:¥2,096/小时

¥504,000/月

PD 分离模式:¥1,008,000/月

千问3.5-397B-A17B

Instruct

支持

III 型模型单元(MU3)

¥1,048/小时

PD分离模式:¥2,096/小时

¥504,000/月

PD 分离模式:¥1,008,000/月

千问3-Max-2025-09-23

Instruct

支持

II 型 / III 型模型单元

(MU2/MU3)

II 型模型单元:¥504/小时

III 型模型单元:¥1,048/小时

II 型模型单元:¥240,288/月

III 型模型单元:¥504,000/月

DeepSeek-v3.2

Instruct

支持

II 型模型单元(MU2)

¥504/小时

PD分离模式:¥896/小时

¥240,288/月

PD 分离模式:¥432,000/月

千问3-235B-A22B-Instruct-2507

Instruct

支持

I / II 型模型单元

(MU1/MU2)

I 型模型单元:¥216/小时

II 型模型单元:¥448/小时

I 型模型单元:¥104,472/月

II 型模型单元:¥216,000/月

千问-Plus-2025-12-01

Instruct/Thinking

支持

I 型模型单元(MU1)

¥216/小时

¥104,472/月

千问-Plus-2025-07-28

Instruct/Thinking

支持

千问-Flash-2025-07-28

Instruct/Thinking

支持

千问2.5-开源版-72B

Instruct

支持

千问2.5-开源版-32B

Instruct

支持

千问3-32B

Instruct

支持

qwen3.5-35b-a3b

Thinking

支持

I 型模型单元(MU1)

¥108/小时

¥52,236/月

千问3.5-9B

Instruct

支持

I 型模型单元(MU1)

¥108/小时

¥52,236/月

千问3.5-27B

Instruct

支持

千问3-Next-80B-A3B-Instruct

Instruct

支持

qwen3.5-122b-a10b

Thinking

支持

I 型模型单元(MU1)

¥216/小时

¥104,472/月

千问3-4B

Instruct

支持

V / I 型模型单元

(MU5/MU1)

V 型模型单元:¥20/小时

I 型模型单元:¥96/小时

V 型模型单元:¥9,500/月

I 型模型单元:¥46,000/月

千问3-1.7B

Instruct

支持

V / I 型模型单元

(MU5/MU1)

V 型模型单元:¥20/小时

I 型模型单元:¥96/小时

V 型模型单元:¥9,500/月

I 型模型单元:¥46,000/月

Text Embedding V4

Embedding

支持

V 型模型单元(MU5)

¥20/小时

¥9,500/月

千问2.5-开源版-3B

Instruct

支持

千问3-Rerank

Rerank

支持

千问3-MoE-Rerank-0.6B

Rerank

支持

千问3-Rerank-0.6B

Rerank

支持

V / VI 型模型单元

(MU5/MU6)

V 型模型单元:¥20/小时

VI 型模型单元:¥18/小时

V 型模型单元:¥9,500/月

VI 型模型单元:¥8,700/月

千问3-Embedding-0.6B

Embedding

支持

VI / V 型模型单元

(MU6/MU5)

¥25/小时

V 型模型单元:¥20/小时

¥12,089/月

V 型模型单元:¥9,500/月

MiniMax-M2.5

Instruct

支持

I 型模型单元(MU1)

¥432/小时

¥208,944/月

kimi-k2.5

Thinking

支持

II 型模型单元(MU2)

¥504/小时

¥240,288/月

模型类型:

  • Instruct - 模型部署后以非思考模式进行推理。

  • Thinking - 模型部署后以思考模式进行推理。

模型部署类型:

  • PD 分离模式 - 降低首 Token 延迟、提高吞吐。

    该部署模式部署的模型在进行模型推理时,将首 Token 计算(Prefill)和后续 Token 计算(Decode)两个计算阶段,拆到不同的计算节点执行。

千问VL

模型服务

模型类型

支持限流

模型单元规格

单价

(不满 1 分钟按 1 分钟计费)

包月单价

(不满 1 天按 1 天计费)

(如在首月内提前退订,日单价将按 1.2 倍计费)

千问VL-Max-2025-08-13

Instruct

支持

VI 型模型单元(MU6)

¥100/小时

¥48,356/月

千问VL-OCR-2025-11-20

Instruct

支持

VI 型模型单元(MU6)

千问3-VL-8B-Instruct

Instruct

支持

I 型模型单元(MU1)

¥108/小时

¥96/小时

¥52,236/月

¥46,000/月

千问3-VL-4B-Instruct

Instruct

支持

千问3-VL-Flash-2025-10-15

Instruct/Thinking

支持

I 型模型单元(MU1)

¥216/小时

¥104,472/月

千问3-VL-Plus-2025-09-23

Instruct/Thinking

支持

千问3-VL-235B-A22B-Instruct

Instruct

支持

千问3-VL-32B-Instruct

Instruct

支持

千问3-VL-Embedding-2B

Embedding

支持

V 型模型单元(MU5)

¥20/小时

¥9,500/月

qwen3-vl-2b-instruct

Thinking

V 型模型单元(MU5)

¥20/小时

¥9,500/月

模型类型:

  • Instruct - 模型部署后以非思考模式进行推理。

  • Thinking - 模型部署后以思考模式进行推理。

  • Instruct/Thinking - 可在模型部署时选择是否开启思考模式

按模型 Token 使用量

费用 = 模型输入 Token 数 × 模型输入单价 + 模型输出 Token 数 × 模型输出单价(最小计费单位:1 token)

  • 仅当对下列基础模型完成 SFT 高效训练并得到自定义模型后,才支持按模型 Token 使用量计费。

基础模型

模型类型

最长上下文

输入单价

输出单价

千问3-32B

Instruct

固定为: 131,072

¥0.002/千Token

非思考模式:¥0.008/千Token

思考模式:¥0.02/千Token

千问3-14B

Instruct

¥0.001/千Token

非思考模式:¥0.004/千Token

思考模式:¥0.01/千Token

千问3-8B

Instruct

¥0.0005/千Token

非思考模式:¥0.002/千Token

思考模式:¥0.005/千Token

千问3-VL-8B-Instruct

Instruct

固定为: 131,072

¥0.0005/千 Token

¥0.002/千 Token

千问 2.5-72B

Instruct

固定为: 131,072

¥0.004/千Token

¥0.012/千Token

千问 2.5-32B

Instruct

¥0.002/千Token

¥0.006/千Token

千问 2.5-14B

Instruct

¥0.001/千Token

¥0.003/千Token

千问 2.5-7B

Instruct

¥0.0005/千Token

¥0.001/千Token

千问2.5-VL-72B

Instruct

固定为: 131,072

¥0.016/千Token

¥0.048/千Token

千问2.5-VL-32B

Instruct

¥0.008/千Token

¥0.024/千Token

千问2.5-VL-7B

Instruct

¥0.002/千Token

¥0.005/千Token

千问 2-开源版-7B

Instruct

固定为: 131,072

¥0.001/千Token

¥0.002/千Token

图片、视频生成模型(预置)-按实例时长计费

费用 = 资源占用时长(小时)× 实例数量 × 实例单价(不满 1 小时按 1 小时计费)

图片生成

模型服务

模型类型

独占实例资源规格

后付费单价

预付费单价

(预付费)

万相-文本生成图像-0521

预置模型

轻量版

¥20/实例/小时

¥10,000/月

视频生成

模型服务

模型类型

独占实例资源规格

后付费单价

预付费单价

(预付费)

悦动人像EMO-detect

预置模型

轻量版

¥20/实例/小时

¥10,000/月

悦动人像EMO

舞动人像AnimateAnyone-detect

舞动人像AnimateAnyone

图像和视频生成模型(预置模型)

计费方式

计费公式

按实例资源占用时长计费

费用 = 资源占用时长(小时)× 实例数量 × 实例单价(不满1小时按1小时计费)

部署前可以在模型部署控制台查看不同模型的预估每小时费用。

实例包月计费/预付费

费用 = 购买时长(月)× 实例数量 × 模型对应的实例单价

购买资源:请前往模型部署控制台(单击右上角的资源池管理)购买。(资源购买完成后便开始计费)

退订资源:请前往主账号的退订管理退订。退订后,将根据未用时长退回未使用金额。(不满1天按1天计费)

图片生成

模型服务

模型类型

独占实例资源规格

后付费单价

预付费单价

(预付费)

万相-文本生成图像-0521

预置模型

轻量版

¥20/实例/小时

¥10,000/月

视频生成

模型服务

模型类型

独占实例资源规格

后付费单价

预付费单价

(预付费)

悦动人像EMO-detect

预置模型

轻量版

¥20/实例/小时

¥10,000/月

悦动人像EMO

舞动人像AnimateAnyone-detect

舞动人像AnimateAnyone

常见问题

Q:模型部署什么时候开始计费?

A:当模型完成部署,即状态为运行中时,开始收取模型部署的费用。模型状态为部署中欠费部署失败时,均不会计费。

如果是包月预付费,模型状态为运行中后,开始消耗包月时间。

Q:取消模型训练会收费么?

A:会收费。如果您主动取消训练,之前已产生的费用仍会被计算。其他原因导致的训练中断,阿里云百炼不会向您收取训练费用。

Q:怎么查看已部署模型的调用统计?

A:请访问模型监控(北京)模型监控(弗吉尼亚)模型监控(新加坡)页面。

image