创建一个新的模型微调训练任务。
创建调优任务
Windows CMD 请将${DASHSCOPE_API_KEY}替换为%DASHSCOPE_API_KEY%,PowerShell请替换为$env:DASHSCOPE_API_KEY
文本生成模型
curl --location --request POST "https://dashscope.aliyuncs.com/api/v1/fine-tunes" \
--header "Authorization: Bearer ${DASHSCOPE_API_KEY}" \
--header 'Content-Type: application/json' \
--data '{
"model":"qwen3-14b",
"training_file_ids":[
"86a9fe7f-dd77-43b0-9834-2170e12339ec",
"03ead352-6190-4328-8016-61821c23d4fc"
],
"hyper_parameters":{
"n_epochs":3,
"batch_size":32,
"max_length":8192,
"learning_rate":"1.6e-5",
"lr_scheduler_type":"linear",
"split":0.9
},
"training_type":"sft",
"finetuned_output_suffix":"suffix"
}'
视频/图像生成模型
curl --location 'https://dashscope.aliyuncs.com/api/v1/fine-tunes' \
--header "Authorization: Bearer ${DASHSCOPE_API_KEY}" \
--header 'Content-Type: application/json' \
--data '{
"model": "wan2.5-i2v-preview",
"training_file_ids": [
"<替换为训练数据集的文件id>"
],
"training_type": "efficient_sft",
"hyper_parameters": {
"n_epochs": 400,
"batch_size": 2,
"learning_rate": 2e-5,
"split": 0.9,
"max_split_val_dataset_sample": 5,
"eval_epochs": 50,
"max_pixels": 36864,
"save_total_limit": 10,
"lora_rank": 32,
"lora_alpha": 32
}
}'
输入参数
|
字段 |
必选 |
类型 |
传参方式 |
参数说明 |
|
training_file_ids |
是 |
Array |
Body |
调优集文件ID列表,文件ID由文件管理 API 产生。 |
|
validation_file_ids |
否 |
Array |
Body |
测试集文件ID列表,文件ID由文件管理 API 产生。 |
|
model |
是 |
String |
Body |
用于调优的基础模型ID基础模型 ID;或其他调优任务产出的模型ID(对已经调优了的模型进行再次调优)。 视频/图像生成模型支持以下 model 值:
|
|
hyper_parameters |
否 |
Map |
Body |
调优时的超参列表。不同模型支持的参数集合及其默认值不同,请在控制台选择相同的模型和调优方式查看实际默认值。
|
|
training_type |
否 |
String |
Body |
调优方法,可选值为: |
|
job_name |
否 |
String |
Body |
调优任务名称 |
|
model_name |
否 |
String |
Body |
调优完成后的模型名称 |
文本生成模型
hyper_parameters内支持的设置
语音合成模型(CosyVoice)
仅适用于 cosyvoice-v3-flash 模型,与文本生成模型的 n_epochs、batch_size、max_length 不可混用。
|
参数 |
必选 |
推荐 |
取值范围 |
说明 |
|
lm_max_epoch |
是 |
60 |
[1, 2147483647] |
LM 调优轮次(epoch 数)。 |
|
lm_step |
是 |
5 |
[1, 2147483647] |
LM 保存 checkpoint 的步长(每多少个 epoch 保存一次)。 |
|
lm_num |
是 |
3 |
[1, 2147483647] |
LM 保留的 checkpoint 数量上限。 |
|
lm_batch_size |
是 |
1000 |
[1, 2147483647] |
LM 批次大小(batch size)。 |
|
fm_max_epoch |
是 |
100 |
[1, 2147483647] |
FM 调优轮次(epoch 数)。 |
|
fm_step |
是 |
10 |
[1, 2147483647] |
FM 保存 checkpoint 的步长(每多少个 epoch 保存一次)。 |
|
fm_num |
是 |
3 |
[1, 2147483647] |
FM 保留的 checkpoint 数量上限。 |
|
fm_batch_size |
是 |
2000 |
[1, 2147483647] |
FM 批次大小(batch size)。 |
CosyVoice 调优当前仅支持 training_type 为 efficient_sft。完整请求示例与端到端流程参见用户指南 CosyVoice模型调优。
视频生成模型 hyper_parameters
仅适用于视频生成模型(wan 系列)。若模型效果不佳或训练不收敛,可以尝试调整 n_epochs 或 learning_rate。建议总训练步数不少于 800 步。
字段 |
类型 |
必选 |
描述 |
推荐值 |
batch_size |
int |
是 |
批次大小。一次性送入模型进行训练的数据条数。
|
以模型为准 |
n_epochs |
int |
是 |
训练循环次数。steps = n_epochs × ⌈数据集大小 / batch_size⌉。建议总步数 ≥ 800。 例如:数据集 5 条,batch_size=2,每轮步数=⌈5/2⌉=3,最小 n_epochs = 800/3 ≈ 267。 |
400 |
learning_rate |
float |
是 |
学习率。控制模型权重更新幅度。过高可能导致模型变差,过低则变化不明显。 |
2e-5 |
eval_epochs |
int |
是 |
验证间隔。取值需 ≥ |
50 |
max_pixels |
int |
是 |
训练视频的最大分辨率(像素总数 = 宽×高)。系统仅对超过该值的视频进行缩放处理。
|
以模型为准 |
split |
float |
否 |
训练集划分比例。取值 (0,1),仅在未指定 validation_file_ids 时生效。 |
0.9 |
max_split_val_dataset_sample |
int |
否 |
自动划分验证集的最大样本数。验证集数量 = min(总数×(1−split), 此值)。 |
5 |
save_total_limit |
int |
否 |
Checkpoint 保存数量上限。系统只保存最后 N 个 Checkpoint。 |
10 |
lora_rank |
int |
否 |
LoRA 低秩矩阵维数。取值须为 2n(16/32/64)。 |
32 |
lora_alpha |
int |
否 |
LoRA 权重缩放系数。取值须为 2n(16/32/64)。 |
32 |
图像生成模型 hyper_parameters
仅适用于 wan2.7-image-pro 模型。图像生成模型使用 max_steps 和 eval_steps 控制训练步数和评估间隔(而非视频模型的 n_epochs/eval_epochs)。
字段 |
类型 |
必选 |
描述 |
推荐值 |
max_steps |
int |
是 |
训练总步数。建议不少于 500 步以确保模型充分收敛。 |
800 |
eval_steps |
int |
是 |
验证间隔。每隔多少步进行一次验证评估并保存模型。 |
200 |
learning_rate |
float |
是 |
学习率。控制模型权重更新幅度。 |
3e-5 |
generation_type |
string |
是 |
生成模式。 |
t2i |
max_pixels |
string |
是 |
训练图片最大分辨率。如 "1k"(1024×1024)、"2k"(2048×2048)。建议与 max_token_length、val_img_size 保持一致。 |
文生图:"2k" |
val_img_size |
string |
是 |
验证图生成分辨率。验证时生成图片的目标分辨率。 |
文生图:"2k" |
max_token_length |
string |
是 |
每步训练的最大 Token 长度。与 max_steps 共同控制训练过程。 |
文生图:"2k" |
gradient_clip |
float |
是 |
梯度裁剪。全局梯度范数裁剪阈值,防止梯度爆炸。-1 表示不裁剪。 |
0.5 |
weight_decay |
float |
是 |
权重衰减。AdamW 解耦式权重衰减系数,用于正则化。 |
0.02 |
lora_rank |
int |
是 |
LoRA 低秩矩阵维数。取值须为 2n(16/32/64)。 |
32 |
lora_alpha |
int |
是 |
LoRA 权重缩放系数。取值须为 2n(16/32/64)。 |
32 |
save_total_limit |
int |
否 |
Checkpoint 保存数量上限。系统只保存最后 N 个 Checkpoint。 |
10 |
split |
float |
否 |
训练集划分比例。取值 (0,1),仅在未指定 validation_file_ids 时生效。 |
0.9 |
返回样例
文本生成模型
{
"request_id": "9654e55a-d74b-4113-aee1-fa19c9384fcc",
"output": {
"job_id": "ft-202410291653-1c7f",
"job_name": "ft-202410291653-1c7f",
"status": "PENDING",
"model": "qwen3-14b",
"base_model": "qwen3-14b",
"training_file_ids": [
"976bd01a-f30b-4414-86fd-50c54486e3ef"
],
"validation_file_ids": [
],
"hyper_parameters": {
"n_epochs": 3,
"batch_size": 32,
"max_length": 8192,
"learning_rate": "1.6e-5",
"lr_scheduler_type": "linear",
"split": 0.9
},
"training_type": "sft",
"create_time": "2024-10-29 16:53:53",
"workspace_id":"llm-v71tlv***",
"user_identity": "1396993924585947",
"modifier": "1396993924585947",
"creator": "1396993924585947",
"group": "llm"
}
}
视频/图像生成模型
重点关注 output.job_id(任务ID)和 output.finetuned_output(微调后产出的新模型名称,用于部署)。
视频生成模型
{
"request_id": "0eb05b0c-02ba-414a-9d0c-xxxxxxxxx",
"output": {
"job_id": "ft-202511111122-xxxx",
"job_name": "ft-202511111122-xxxx",
"status": "PENDING",
"finetuned_output": "wan2.5-i2v-preview-ft-202511111122-xxxx",
"model": "wan2.5-i2v-preview",
"base_model": "wan2.5-i2v-preview",
"training_file_ids": [
"xxxxxxxxxxxx"
],
"validation_file_ids": [],
"hyper_parameters": {
"n_epochs": 400,
"batch_size": 2,
"learning_rate": 2.0E-5,
"split": 0.9,
"eval_epochs": 50
},
"training_type": "efficient_sft",
"create_time": "2025-11-11 11:22:22"
}
}
图像生成模型
{
"request_id": "0eb05b0c-02ba-414a-9d0c-xxxxxxxxx",
"output": {
"job_id": "ft-202606030110-xxxx",
"job_name": "ft-202606030110-xxxx",
"status": "PENDING",
"finetuned_output": "wan2.7-image-pro-ft-202606030110-xxxx",
"model": "wan2.7-image-pro",
"base_model": "wan2.7-image-pro",
"training_file_ids": [
"xxxxxxxxxxxx"
],
"validation_file_ids": [],
"hyper_parameters": {
"max_steps": 800,
"learning_rate": 3.0E-5,
"eval_steps": 200,
"max_token_length": "2k",
"max_pixels": "2k",
"val_img_size": "2k",
"generation_type": "t2i",
"lora_rank": 32,
"lora_alpha": 32
},
"training_type": "efficient_sft",
"create_time": "2026-06-03 01:10:47"
}
}
返回参数
|
参数名称 |
类型 |
参数说明 |
|
request_id |
String |
本次请求的ID。 |
|
output |
Object |
本次调优任务的详细信息。 |
|
output.job_id |
String |
本次调优的任务ID,可用于查询训练任务详情、查询训练日志、取消训练任务、删除训练任务等接口。 生成规则: |
|
output.jobs_name |
String |
同 |
|
output.status |
String |
本次调优任务的状态。 |
|
output.model |
String |
调优任务使用的模型ID。 |
|
output.base_model |
String |
调优任务使用的模型对应的基础模型ID。 比如:调优任务 |
|
output.training_file_ids |
Array |
调优文件ID列表。 |
|
output.validation_file_ids |
Array |
验证文件ID列表。 |
|
output.hyper_parameters |
Object |
显性声明过的超参表。 |
|
output.training_type |
String |
调优方法。 |
|
output.create_time |
String |
调优任务创建时间。 |
|
output.workspace_id |
String |
调优任务所属的业务空间ID。 |
|
output.user_identity |
String |
该调优任务隶属的主账号UID。 |
|
output.modifier |
String |
对该调优任务进行最后一次操作的账号UID。 比如:某个子账号取消了该任务,该子账号UID会显示在这里。 |
|
output.creator |
String |
该调优任务创建人UID。 |
|
output.group |
String |
模型调优的任务类型。 |
|
任务状态 |
含义 |
|
PENDING |
调优待开始。 |
|
QUEUING |
调优正在排队(同时只有一个调优任务可以进行) |
|
RUNNING |
调优正在进行中。 |
|
CANCELING |
调优正在取消中。 |
|
SUCCEEDED |
调优成功。 |
|
FAILED |
调优失败。 |
|
CANCELED |
调优已经取消。 |
请求错误码说明
请求异常时返回
|
字段 |
类型 |
描述 |
示例值 |
|
code |
String |
错误码。 |
NotFound |
|
request_id |
String |
本次请求的系统唯一码。 |
6332fb02-3111-43f0-bf79-f9e8c5ffa7f9 |
|
message |
String |
错误信息。 |
Not Found! |
请求异常示例
{
"code": "NotFound",
"request_id": "BE213CDD-8A5C-59EE-9A67-055EAB0CB59B",
"message": "Not Found!"
}
错误码列表
|
HTTP状态码 |
错误码 |
错误信息举例 |
含义 |
处理方式 |
|
400 |
InvalidParameter |
Missing training files |
参数错误,缺少参数或者参数格式问题等。 |
根据错误信息,修正您的参数。 |
|
400 |
UnsupportedOperation |
The fine-tune job can not be deleted because it is succeeded,failed or canceled |
当资源处于特定状态时,无法对其进行操作。 |
待要操作的资源到达可操作状态时再进行操作。 |
|
404 |
NotFound |
Not found! |
要查询/操作的资源不存在。 |
检查要查询/操作的资源ID是否错误。 |
|
409 |
Conflict |
Model instance xxxxx already exists, please specify a suffix |
已存在deployed_model名为xxxxx的部署实例,需要指定后缀进行区分。 |
为部署指定唯一的后缀。 |
|
429 |
Throttling |
|
资源的创建触发平台限制。 |
|
|
500 |
InternalError |
Internal server error! |
内部错误。 |
记录 request_id,通过工单联系阿里云工程师进行排查。 |