列举当前账号下所有的模型压缩任务。
5.4 列举压缩任务
支持按状态、模型、模板、量化规格、算法、时间范围、任务名/ID 等过滤,支持创建时间排序和分页。
地址
GET /api/v1/fine-tunes/compress/jobs请求参数
参数 | 类型 | 必选 | 默认 | 说明 |
status | String | 否 | - | 按状态过滤(如 RUNNING、SUCCEEDED) |
model | String | 否 | - | 按源模型 ID 过滤 |
template_id | String | 否 | - | 按模板 ID 过滤 |
quant_spec | String | 否 | - | 按量化规格过滤(如 |
quant_method | String | 否 | - | 按量化算法过滤(如 |
start_time | String | 否 | - | 任务开始时间不早于该值。格式: |
end_time | String | 否 | - | 任务结束时间不晚于该值,格式同 |
job_name | String | 否 | - | 按任务名称模糊匹配 |
job_id | String | 否 | - | 按任务 ID 模糊匹配 |
search_key | String | 否 | - | 搜索关键字。不传 |
select_key | String | 否 | - |
|
sort_by | String | 否 | create_time | 排序字段,目前仅支持 |
sort_order | String | 否 | desc | 排序方向, |
page_no | Integer | 否 | 1 | 页码 |
page_size | Integer | 否 | 10 | 每页数量,最大 100 |
请求示例
# 综合搜索:按状态 + 算法 + 分页
curl "https://dashscope.aliyuncs.com/api/v1/fine-tunes/compress/jobs?status=SUCCEEDED&quant_method=gptq&page_size=10" \
-H "Authorization: Bearer ${API_KEY}"
# 时间范围 + 按任务名搜索 + 创建时间升序
curl "https://dashscope.aliyuncs.com/api/v1/fine-tunes/compress/jobs?start_time=2026-04-01&end_time=2026-04-30&search_key=qwen3&select_key=job_name&sort_by=create_time&sort_order=asc" \
-H "Authorization: Bearer ${API_KEY}"响应示例
{
"request_id": "uuid-string",
"output": {
"total": 42,
"page_no": 1,
"page_size": 10,
"jobs": [
{
"job_id": "quant-202604111200-a1b2",
"job_name": "qwen3.5-flash 压缩任务",
"status": "SUCCEEDED",
"model": "qwen3.5-flash-2026-02-23-ft-***",
"base_model": "qwen3.5-flash-2026-02-23",
"template_id": "quant-flash-nvfp4-mlp-nomtp",
"template_name": "W4A4 NVFP4高性能压缩-MU5/MU8/MU9",
"training_type": "quantization",
"compress_type": "quantization",
"custom_calibration_file_ids": ["file-***"],
"quantized_output": "qwen3.5-flash-2026-02-23-test-quant-202604111200-a1b2",
"create_time": "2026-04-11 12:00:00",
"start_time": "2026-04-11 12:02:30",
"end_time": "2026-04-11 13:02:30",
"group": "quantization",
"usage": 3600
}
]
}
}响应参数
字段 | 类型 | 说明 |
total | Integer | 符合条件的任务总数 |
page_no | Integer | 当前页码 |
page_size | Integer | 每页数量 |
jobs | Array | 任务列表,字段含义同查询压缩任务 |
七、错误码
7.1 通用错误码
错误码 | HTTP | 说明 |
| 400 | 请求参数不合法 |
| 400 | 缺少必选参数 |
| 401 | 认证失败 |
| 403 | 无权限访问 |
| 404 | 资源不存在 |
| 400 | 资源状态不允许该操作(如取消已终态任务) |
| 429 | 配额超限 |
| 500 | 服务内部错误 |
7.2 业务错误码
以下业务错误码按场景分类列出。对外 Code 为接口实际返回的 code 字段值。
参数校验类
对外 Code | HTTP | 说明 |
| 400 | 缺少必选参数 |
| 400 | 缺少必选参数 |
| 400 | 不支持对基础模型直接量化 |
| 400 | 指定的配置模板不存在 |
| 400 | 当前模型不支持该压缩模板 |
| 400 | 模型不支持量化 |
| 400 | LoRA 调优模型不支持量化 |
| 400 | 模型数据不可用 |
| 400 | 任务名称包含不支持的字符 |
| 400 |
|
| 400 | 源模型尚未就绪 |
| 403 | 无权使用该压缩模板 |
超参数校验类
对外 Code | HTTP | 说明 |
| 400 | 必选超参数未传 |
| 400 | 传入了未知超参数 |
| 400 | 超参数值不在枚举值列表中 |
| 400 | 超参数值超出数值范围 |
| 400 | 超参数值不是合法数字 |
任务查询类
对外 Code | HTTP | 说明 |
| 404 | 指定的压缩任务不存在 |
| 400 | 缺少必选参数 |
分页与时间参数类
对外 Code | HTTP | 说明 |
| 400 | 页码参数不合法(须 ≥ 1) |
| 400 | 每页数量不合法(须 1~100) |
| 400 | 时间格式不合法 |
7.3 错误响应示例
{
"request_id": "uuid-string",
"code": "InvalidParameter",
"message": "The specified model 'xxx-lora-yyy' is a LoRA model and not supported for quantization."
}