列举压缩任务

更新时间:
复制为 MD 格式

列举当前账号下所有的模型压缩任务。

5.4 列举压缩任务

支持按状态、模型、模板、量化规格、算法、时间范围、任务名/ID 等过滤,支持创建时间排序和分页。

地址

GET /api/v1/fine-tunes/compress/jobs

请求参数

参数

类型

必选

默认

说明

status

String

-

按状态过滤(如 RUNNING、SUCCEEDED)

model

String

-

按源模型 ID 过滤

template_id

String

-

按模板 ID 过滤

quant_spec

String

-

按量化规格过滤(如 w4a16w8a8

quant_method

String

-

按量化算法过滤(如 gptqawqfp8

start_time

String

-

任务开始时间不早于该值。格式:yyyy-MM-dd HH:mm:ss / ISO-8601 / yyyy-MM-dd

end_time

String

-

任务结束时间不晚于该值,格式同 start_time

job_name

String

-

按任务名称模糊匹配

job_id

String

-

按任务 ID 模糊匹配

search_key

String

-

搜索关键字。不传 select_key 时同时模糊匹配 job_idjob_name;配合 select_key 时仅匹配指定字段

select_key

String

-

search_key 的搜索字段,可选 job_id / job_name

sort_by

String

create_time

排序字段,目前仅支持 create_time

sort_order

String

desc

排序方向,asc 升序 / desc 降序

page_no

Integer

1

页码

page_size

Integer

10

每页数量,最大 100

请求示例

# 综合搜索:按状态 + 算法 + 分页
curl "https://dashscope.aliyuncs.com/api/v1/fine-tunes/compress/jobs?status=SUCCEEDED&quant_method=gptq&page_size=10" \
  -H "Authorization: Bearer ${API_KEY}"

# 时间范围 + 按任务名搜索 + 创建时间升序
curl "https://dashscope.aliyuncs.com/api/v1/fine-tunes/compress/jobs?start_time=2026-04-01&end_time=2026-04-30&search_key=qwen3&select_key=job_name&sort_by=create_time&sort_order=asc" \
  -H "Authorization: Bearer ${API_KEY}"

响应示例

{
  "request_id": "uuid-string",
  "output": {
    "total": 42,
    "page_no": 1,
    "page_size": 10,
    "jobs": [
      {
        "job_id": "quant-202604111200-a1b2",
        "job_name": "qwen3.5-flash 压缩任务",
        "status": "SUCCEEDED",
        "model": "qwen3.5-flash-2026-02-23-ft-***",
        "base_model": "qwen3.5-flash-2026-02-23",
        "template_id": "quant-flash-nvfp4-mlp-nomtp",
        "template_name": "W4A4 NVFP4高性能压缩-MU5/MU8/MU9",
        "training_type": "quantization",
        "compress_type": "quantization",
        "custom_calibration_file_ids": ["file-***"],
        "quantized_output": "qwen3.5-flash-2026-02-23-test-quant-202604111200-a1b2",
        "create_time": "2026-04-11 12:00:00",
        "start_time": "2026-04-11 12:02:30",
        "end_time": "2026-04-11 13:02:30",
        "group": "quantization",
        "usage": 3600
      }
    ]
  }
}

响应参数

字段

类型

说明

total

Integer

符合条件的任务总数

page_no

Integer

当前页码

page_size

Integer

每页数量

jobs

Array

任务列表,字段含义同查询压缩任务

七、错误码

7.1 通用错误码

错误码

HTTP

说明

InvalidParameter

400

请求参数不合法

MissingParameter

400

缺少必选参数

Unauthorized

401

认证失败

Forbidden

403

无权限访问

ResourceNotFound

404

资源不存在

UnsupportedOperation

400

资源状态不允许该操作(如取消已终态任务)

QuotaExceeded

429

配额超限

InternalError

500

服务内部错误

7.2 业务错误码

以下业务错误码按场景分类列出。对外 Code 为接口实际返回的 code 字段值。

参数校验类

对外 Code

HTTP

说明

InvalidParameter

400

缺少必选参数 model

InvalidParameter

400

缺少必选参数 template_id

InvalidParameter

400

不支持对基础模型直接量化

InvalidParameter

400

指定的配置模板不存在

InvalidParameter

400

当前模型不支持该压缩模板

InvalidParameter

400

模型不支持量化

InvalidParameter

400

LoRA 调优模型不支持量化

InvalidParameter

400

模型数据不可用

InvalidParameter

400

任务名称包含不支持的字符

InvalidParameter

400

output_model_suffix 超过 8 字符

InvalidParameter

400

源模型尚未就绪

AccessDenied

403

无权使用该压缩模板

超参数校验类

对外 Code

HTTP

说明

InvalidParameter

400

必选超参数未传

InvalidParameter

400

传入了未知超参数

InvalidParameter

400

超参数值不在枚举值列表中

InvalidParameter

400

超参数值超出数值范围

InvalidParameter

400

超参数值不是合法数字

任务查询类

对外 Code

HTTP

说明

NotFound

404

指定的压缩任务不存在

InvalidParameter

400

缺少必选参数 job_id

分页与时间参数类

对外 Code

HTTP

说明

InvalidParameter

400

页码参数不合法(须 ≥ 1)

InvalidParameter

400

每页数量不合法(须 1~100)

InvalidParameter

400

时间格式不合法

7.3 错误响应示例

{
  "request_id": "uuid-string",
  "code": "InvalidParameter",
  "message": "The specified model 'xxx-lora-yyy' is a LoRA model and not supported for quantization."
}