查询调优日志

更新时间:
复制为 MD 格式

查询指定模型微调训练任务的训练日志。

获取调优任务日志

Windows CMD 请将${DASHSCOPE_API_KEY}替换为 %DASHSCOPE_API_KEY%,PowerShell 请替换为 $env:DASHSCOPE_API_KEY
curl --location --request GET "https://dashscope.aliyuncs.com/api/v1/fine-tunes/<替换为您的调优任务id>/logs?offset=10&line=10" \
      --header "Authorization: Bearer ${DASHSCOPE_API_KEY}" \
      --header 'Content-Type: application/json' 

输入参数

字段

类型

传参方式

必选

描述

job_id

String

Url Path

要打印日志的调优任务ID,可通过创建训练任务列举训练任务接口获取。

offset

Number

Query

忽略前offset行输出,从第offset+1行开始读取。不能超过当前已有输出的总行数,超过则不会有输出信息返回。默认值为0。

line

Number

Query

offset+1行(包含)起,读取line行输出信息,如果本次请求的输出不足line行,则以实际输出为准。默认值为100,上限为1000。

返回样例

{
          "request_id": "ce49b45d-fe46-474e-9e1b-3e7427ffdf5a",
          "output": {
              "total": 20,
              "logs": [
                  "{'train_runtime': 216.3999, 'train_samples_per_second': 2.066, 'train_steps_per_second': 0.014, 'train_loss': 0.9122632344563802, 'epoch': 0.8571428571428571}",
                  " Actual number of consumed tokens is 279808!",
                  " Uploaded checkpoint!",
                  " Fine-tune succeeded!",
                  " use checkpoint-3 as final checkpoint",
                  "2024-10-29 17:03:47,719 - INFO - transfer for inference succeeded, start to deliver it for inference",
                  "2024-10-29 17:09:43,322 - INFO - start to save checkpoint",
                  "2024-10-29 17:11:24,689 - INFO - finetune-job succeeded",
                  "2024-10-29 17:11:25,130 - INFO - training usage 279808",
                  "2024-10-29 17:11:25,175 - INFO - ##FT_COMPLETE##"
              ]
          }
      }

返回参数

参数名称

类型

参数说明

request_id

String

本次请求的ID。

output

Object

查询返回的详细信息。

output.total

Integer

日志总计行数。

output.logs

Array

输出的日志。

请求错误码说明

请求异常时返回

字段

类型

描述

示例值

code

String

错误码。

NotFound

request_id

String

本次请求的系统唯一码。

6332fb02-3111-43f0-bf79-f9e8c5ffa7f9

message

String

错误信息。

Not Found!

请求异常示例

{
        "code": "NotFound",
        "request_id": "BE213CDD-8A5C-59EE-9A67-055EAB0CB59B",
        "message": "Not Found!"
      }

错误码列表

HTTP状态码

错误码

错误信息举例

含义

处理方式

400

InvalidParameter

Missing training files

参数错误,缺少参数或者参数格式问题等。

根据错误信息,修正您的参数。

400

UnsupportedOperation

The fine-tune job can not be deleted because it is succeeded,failed or canceled

当资源处于特定状态时,无法对其进行操作。

待要操作的资源到达可操作状态时再进行操作。

404

NotFound

Not found!

要查询/操作的资源不存在。

检查要查询/操作的资源ID是否错误。

409

Conflict

Model instance xxxxx already exists, please specify a suffix

已存在deployed_model名为xxxxx的部署实例,需要指定后缀进行区分。

为部署指定唯一的后缀。

429

Throttling

  • Too many fine-tune job in running, please retry later.

  • Only 20 fine-tune job in running or succeeded allowed per user.

资源的创建触发平台限制。

  • 删除不再使用的模型。

  • 如您确实需要提高调优任务的并发量或保留更多调优成功的模型,请联系商务经理。

500

InternalError

Internal server error!

内部错误。

记录 request_id,通过工单联系阿里云工程师进行排查。