GetJob - 获取任务详情

获取一个任务的详细配置和运行时信息。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。
  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:
    • 对于必选的资源类型,用前面加 * 表示。
    • 对于不支持资源级授权的操作,用全部资源表示。
  • 条件关键字:是指云产品自身定义的条件关键字。
  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作访问级别资源类型条件关键字关联操作
paidlc:GetJobget
*全部资源
*

请求语法

GET /api/v1/jobs/{JobId} HTTP/1.1

请求参数

名称类型必填描述示例值
JobIdstring

任务 ID。如何获取任务 ID,请参见 ListJobs

dlc*******
NeedDetailboolean

是否返回作业详情信息,默认为 true

true

返回参数

名称类型描述示例值
object

JSON 格式的字符串。

JobIdstring

任务 ID。

dlc*******
JobTypestring

任务类型。由 CreateJob API 中的 JobType 指定。

TFJob
DisplayNamestring

任务名称。

tf-mnist-test
UserIdstring

任务提交人的阿里云 UID。

12*********
Statusstring

任务运行状态,可能值:

  • Creating
  • Queuing
  • Bidding (当前仅限灵骏 Spot 作业)
  • EnvPreparing
  • SanityChecking
  • Running
  • Restarting
  • Stopping
  • SucceededReserving
  • FailedReserving
  • Succeeded
  • Failed
  • Stopped
Stopped
WorkspaceIdstring

任务所属工作空间 ID。

268
WorkspaceNamestring

任务所属工作空间名称。

dlc-workspace
ResourceIdstring

任务运行所在的资源组 ID。

r******
ResourceLevelstring

任务运行时使用的资源级别。

L0
ReasonCodestring

状态详情码,对当前状态(Status)下的子状态的一个分类。

JobStoppedByUser
ReasonMessagestring

状态详情的详细描述。

Job is stopped by user.
JobSpecsarray

任务中的节点配置,参考 CreateJob API 中的 JobSpecs

JobSpecsJobSpec

描述一种节点类型的详细配置。

UserCommandstring

每个节点的启动命令。

python /root/code/mnist.py
DataSourcesarray<object>

数据源列表。

DataSourcesobject

数据源。

DataSourceIdstring

数据源 ID。

d*******
MountPathstring

本地挂载路径,可选参数,默认为空(表示使用数据源中挂载路径)。

/mnt/data/
Uristring

数据源路径

oss://bucket.oss-cn-hangzhou-internal.aliyuncs.com/path/
CodeSourceobject

代码源。

CodeSourceIdstring

代码源 ID。

code******
Branchstring

代码分支。

master
Commitstring

代码 CommitID。

44da109b59f8596152987eaa8f3b2487xxxxxx
MountPathstring

本地挂载路径。

/mnt/data
ThirdpartyLibsarray

需要安装的 Python 三方库列表。

ThirdpartyLibsstring

第三方 Python 库。

numpy==1.16.1
ThirdpartyLibDirstring

三方库(requirements.txt)文件所在文件夹。

/root/code/
Envsobject

环境变量配置。

string

环境变量 Key 和 Value。

ENABLE_DEBUG_MODE
UserVpcobject

用户 VPC

VpcIdstring

用户 VPC 的 id

vpc-abcdef****
SwitchIdstring

用户交换机的 id

vs-abcdef****
SecurityGroupIdstring

用户安全组的 id

sg-abcdef****
ExtendedCidrsarray

扩展网段,示例:192.168.0.1/24

扩展网段string

扩展网段

192.168.0.1/24
DefaultRoutestring

默认路由。此参数只在通用计算资源下有效,取值如下:

eth0:表示使用默认网卡,通过公共网关访问外部网络。 eth1:表示使用用户弹性网卡,通过私有网关访问外部网络。

GmtCreateTimestring

任务创建时间(UTC)。

2021-01-12T14:35:01Z
GmtSubmittedTimestring

任务提交到集群的时间(UTC)。

2021-01-12T14:36:01Z
GmtRunningTimestring

任务开始运行的时间(UTC)。

2021-01-12T14:36:21Z
GmtSuccessedTimestring

任务正常结束的时间(UTC)。

2021-01-12T15:36:08Z
GmtStoppedTimestring

任务停止的时间(UTC)。

2021-01-12T15:36:08Z
GmtFailedTimestring

任务运行失败的时间(UTC)。

2021-01-12T15:36:08Z
Durationlong

任务运行时长,单位:秒。

3602
Podsarray<object>

任务运行中的所有节点。

Podsobject

节点数组。

Typestring

节点类型,与 CreateJob 中的 JobSpecs 中的某个 JobSpec 对应。

Worker
PodIdstring

节点 ID,可用于 GetPodLogs 和 GetPodEvents API 获取节点的详细日志和事件。

Worker
PodUidstring

Pod UID。

fe846462-af2c-4521-bd6f-96787a57591d
Statusstring

节点状态。可能值:

  • Pending
  • Running
  • Succeeded
  • Failed
  • Unknown
Running
Ipstring

节点的网络 IP 地址。

10.0.1.2
GmtCreateTimestring

Pod 创建时间(UTC)。

2021-01-12T14:36:01Z
GmtStartTimestring

节点启动时间(UTC)。

2021-01-12T14:36:01Z
GmtFinishTimestring

节点结束时间(UTC)。

2021-01-12T15:36:05Z
HistoryPodsarray<object>

历史 Pods。

HistoryPodsobject

历史 Pod 数组。

Typestring

Pod 类型。

Worker
PodIdstring

Pod ID。

Worker
PodUidstring

Pod UID。

fe846462-af2c-4521-bd6f-96787a57591d
Statusstring

Pod 状态。

Failed
Ipstring

Pod IP。

10.0.1.3
GmtCreateTimestring

Pod 创建时间(UTC)。

2021-01-12T14:36:01Z
GmtStartTimestring

Pod 启动时间(UTC)。

2021-01-12T14:36:01Z
GmtFinishTimestring

Pod 结束时间(UTC)。

2021-01-12T14:36:01Z
SubStatusstring

Pod 子状态,例如抢占状态。取值如下:

  • Normal
  • Evicted
Normal
ResourceTypestring

Pod 资源使用类型。

Normal
Durationdouble

Pod 运行时长

NodeNamestring

节点名称

PodIpsarray

Pod 的 IP 地址

PodIpsPodNetworkInterface

每张网卡对应的 IP 地址

SubStatusstring

Pod 子状态,例如抢占状态。取值如下:

  • Normal
  • Evicted
Normal
ResourceTypestring

Pod 资源使用类型。

Normal
Durationdouble

Pod 运行时长

NodeNamestring

节点名称

PodIpsarray

Pod 的 IP 地址

PodIpsPodNetworkInterface

每张网卡对应的 IP 地址

RequestIdstring

请求 ID,用于诊断和答疑。

473469C7-AA6F-4DC5-B3DB-xxxxxxxx
SettingsJobSettings

作业额外参数配置。

ClusterIdstring

集群 ID。

a*****
ElasticSpecJobElasticSpec

弹性任务参数。

EnabledDebuggerboolean

是否开启 debugger 任务。

false
Priorityinteger

任务的优先级。可能值为 1~9。

1
SubStatusstring

作业子状态,例如抢占重试状态。

Restarting
RestartTimesstring

作业已使用的重试次数和最大重试次数。

0/10
StatusHistoryarray

历史状态。

StatusHistoryStatusTransitionItem

历史状态。

TenantIdstring

租户 ID。

GAR***W134
ResourceTypestring

资源类型,可选值:ECS,Lingjun,ACS

ECS
CredentialConfigCredentialConfig

访问凭证配置。

Accessibilitystring

任务的可见性,取值如下:

  • PUBLIC:在此工作空间中,对所有人可见。
  • PRIVATE(默认值):在此工作空间中,仅对您和管理员可见。
PRIVATE
RestartRecordarray<object>

作业重启记录

RestartRecordobject

作业重启记录

DetailErrorInfoListarray<object>

错误信息列表

DetailErrorInfoListobject

错误信息

AddJobLevelBlacklistboolean

作业黑名单

AddNodeToBlacklistboolean

节点黑名单

DetailErrorMsgstring

详细错误信息

ErrorCodestring

错误码

ErrorMsgstring

错误信息

ErrorSourcestring

错误源

Nodestring

节点

Podstring

实例

TriggerRestartboolean

是否触发重启

JobRestartCountlong

作业重启次数

OccurPhasestring

发生的阶段

OccurTimestring

发生的时间

Reasonstring

原因

RestartDurationInSeclong

重启时间

RestartFailReasonstring

重启失败原因

RestartStatusstring

重启状态

TriggerIDstring

TriggerID

JobReplicaStatusesarray

作业副本状态

JobReplicaStatusesJobReplicaStatus

作业副本状态

GmtFinishTimestring

任务结束时间(UTC)。

2021-01-12T15:36:08Z

示例

正常返回示例

JSON格式

{
  "JobId": "dlc*******",
  "JobType": "TFJob",
  "DisplayName": "tf-mnist-test",
  "UserId": "12*********",
  "Status": "Stopped",
  "WorkspaceId": 268,
  "WorkspaceName": "dlc-workspace",
  "ResourceId": "r******",
  "ResourceLevel": "L0",
  "ReasonCode": "JobStoppedByUser",
  "ReasonMessage": "Job is stopped by user.",
  "JobSpecs": [
    {
      "Type": "Worker",
      "Image": "registry-vpc.cn-hangzhou.aliyuncs.com/cloud-dsw/tensorflow:1.12PAI-gpu-py36-cu101-ubuntu18.04",
      "ImageConfig": {
        "DockerRegistry": "docker****registry.com",
        "Username": " username",
        "Password": "password",
        "Auth": ""
      },
      "PodCount": 1,
      "EcsSpec": "ecs.c6.large",
      "ExtraPodSpec": {
        "SideCarContainers": [
          {
            "Name": "data-init",
            "Image": "registry.cn-hangzhou.aliyuncs.com/pai-dlc/curl:v1.0.0",
            "Command": [
              "curl www.aliyun.com"
            ],
            "Args": [
              "-v"
            ],
            "WorkingDir": "/root",
            "Env": [
              {
                "Name": "ENABLE_DEBUG",
                "Value": true
              }
            ],
            "Resources": {
              "Limits": {
                "key": "{'cpu': '1', 'memory': '1000Mi'}"
              },
              "Requests": {
                "key": "{'cpu': '1', 'memory': '1000Mi'}"
              }
            }
          }
        ],
        "InitContainers": [
          {
            "Name": "data-init",
            "Image": "registry.cn-hangzhou.aliyuncs.com/pai-dlc/curl:v1.0.0",
            "Command": [
              "curl www.aliyun.com"
            ],
            "Args": [
              "-v"
            ],
            "WorkingDir": "/root",
            "Env": [
              {
                "Name": "ENABLE_DEBUG",
                "Value": true
              }
            ],
            "Resources": {
              "Limits": {
                "key": "{'cpu': '1', 'memory': '1000Mi'}"
              },
              "Requests": {
                "key": "{'cpu': '1', 'memory': '1000Mi'}"
              }
            }
          }
        ],
        "PodLabels": {
          "key": "example-lable"
        },
        "PodAnnotations": {
          "key": "example-annotation"
        },
        "SharedVolumeMountPaths": [
          "/root/share/"
        ],
        "SharedVolumeEphemeralStorageSize": "",
        "Lifecycle": {
          "PreStop": {
            "Exec": {
              "Command": [
                ""
              ]
            }
          },
          "PostStart": {
            "Exec": {
              "Command": [
                ""
              ]
            }
          }
        },
        "MainContainerSecurityContext": {
          "RunAsUser": 1000,
          "Privileged": true,
          "Capabilities": {
            "Add": [
              ""
            ],
            "Drop": [
              ""
            ]
          },
          "RunAsGroup": 1000,
          "SeccompProfile": {
            "Type": "Unconfined",
            "LocalhostProfile": "my-profiles/profile-allow.json"
          }
        }
      },
      "ResourceConfig": {
        "CPU": 10,
        "GPU": 3,
        "Memory": "10Gi",
        "SharedMemory": "5Gi",
        "GPUType": "Tesla-V100-16G"
      },
      "UseSpotInstance": false,
      "SpotSpec": {
        "SpotStrategy": "SpotWithPriceLimit",
        "SpotDiscountLimit": 0.8,
        "SpotPriceLimit": 0.4744
      },
      "AssignNodeSpec": {
        "EnableAssignNode": true,
        "NodeNames": "lingjxxxxxxxx",
        "AntiAffinityNodeNames": "lingjxxxxxxxx"
      },
      "LocalMountSpecs": [
        {
          "MountPath": "",
          "MountMode": "",
          "LocalPath": ""
        }
      ],
      "AutoScalingSpec": {
        "ScalingStrategy": "",
        "MinReplicas": 0,
        "MaxReplicas": 0,
        "PodsToDelete": [
          ""
        ],
        "AutoscalingMetricSpec": {
          "MetricName": "",
          "TargetValue": 0
        }
      },
      "ServiceSpec": {
        "ServiceMode": "PerRole",
        "ExtraPorts": [
          8081
        ],
        "DefaultPort": 8080
      },
      "IsCheif": true,
      "IsChief": true,
      "RestartPolicy": "ExitCode",
      "SystemDisk": {
        "Size": 0,
        "Category": "",
        "PerformanceLevel": ""
      }
    }
  ],
  "UserCommand": "python /root/code/mnist.py",
  "DataSources": [
    {
      "DataSourceId": "d*******",
      "MountPath": "/mnt/data/",
      "Uri": "oss://bucket.oss-cn-hangzhou-internal.aliyuncs.com/path/"
    }
  ],
  "CodeSource": {
    "CodeSourceId": "code******",
    "Branch": "master",
    "Commit": "44da109b59f8596152987eaa8f3b2487xxxxxx",
    "MountPath": "/mnt/data"
  },
  "ThirdpartyLibs": [
    "numpy==1.16.1"
  ],
  "ThirdpartyLibDir": "/root/code/",
  "Envs": {
    "key": "ENABLE_DEBUG_MODE"
  },
  "UserVpc": {
    "VpcId": "vpc-abcdef****",
    "SwitchId": "vs-abcdef****",
    "SecurityGroupId": "sg-abcdef****",
    "ExtendedCidrs": [
      "192.168.0.1/24"
    ],
    "DefaultRoute": ""
  },
  "GmtCreateTime": "2021-01-12T14:35:01Z",
  "GmtSubmittedTime": "2021-01-12T14:36:01Z",
  "GmtRunningTime": "2021-01-12T14:36:21Z",
  "GmtSuccessedTime": "2021-01-12T15:36:08Z",
  "GmtStoppedTime": "2021-01-12T15:36:08Z",
  "GmtFailedTime": "2021-01-12T15:36:08Z",
  "Duration": 3602,
  "Pods": [
    {
      "Type": "Worker",
      "PodId": "Worker",
      "PodUid": "fe846462-af2c-4521-bd6f-96787a57591d",
      "Status": "Running",
      "Ip": "10.0.1.2",
      "GmtCreateTime": "2021-01-12T14:36:01Z",
      "GmtStartTime": "2021-01-12T14:36:01Z",
      "GmtFinishTime": "2021-01-12T15:36:05Z",
      "HistoryPods": [
        {
          "Type": "Worker",
          "PodId": "Worker",
          "PodUid": "fe846462-af2c-4521-bd6f-96787a57591d",
          "Status": "Failed",
          "Ip": "10.0.1.3",
          "GmtCreateTime": "2021-01-12T14:36:01Z",
          "GmtStartTime": "2021-01-12T14:36:01Z",
          "GmtFinishTime": "2021-01-12T14:36:01Z",
          "SubStatus": "Normal",
          "ResourceType": "Normal",
          "Duration": 0,
          "NodeName": "",
          "PodIps": [
            {
              "InterfaceName": "",
              "Ip": ""
            }
          ]
        }
      ],
      "SubStatus": "Normal",
      "ResourceType": "Normal",
      "Duration": 0,
      "NodeName": "",
      "PodIps": [
        {
          "InterfaceName": "",
          "Ip": ""
        }
      ]
    }
  ],
  "RequestId": "473469C7-AA6F-4DC5-B3DB-xxxxxxxx",
  "Settings": {
    "BusinessUserId": "16****",
    "Caller": "SilkFlow",
    "Tags": {
      "key": "key:value"
    },
    "PipelineId": "pid-12****",
    "EnableTideResource": true,
    "EnableErrorMonitoringInAIMaster": false,
    "ErrorMonitoringArgs": "--enable-log-hang-detection true",
    "EnableRDMA": true,
    "EnableOssAppend": true,
    "OversoldType": "AcceptQuotaOverSold",
    "AdvancedSettings": {
      "test": "test",
      "test2": 1
    },
    "Driver": "535.54.03",
    "EnableSanityCheck": true,
    "SanityCheckArgs": "--sanity-check-timing=AfterJobFaultTolerant --sanity-check-timeout-ops=MarkJobFail",
    "JobReservedMinutes": 30,
    "JobReservedPolicy": "Always",
    "EnableCPUAffinity": true,
    "DisableEcsStockCheck": false,
    "AllocateAllRDMADevices": true,
    "EnableDSWDev": true,
    "DataJuicerConfig": {
      "ExecutionMode": "standalone",
      "CommandType": "config"
    },
    "ModelConfig": {
      "ModelName": ""
    }
  },
  "ClusterId": "a*****",
  "ElasticSpec": {
    "EnableElasticTraining": true,
    "MinParallelism": 1,
    "MaxParallelism": 8,
    "AIMasterType": "",
    "AIMasterDockerImage": "",
    "EnablePsJobElasticWorker": true,
    "EnableAIMaster": true,
    "EnablePsResourceEstimate": true,
    "EnablePsJobElasticPS": true,
    "PSMinParallelism": 4,
    "PSMaxParallelism": 10,
    "ElasticStrategy": "",
    "EnableEDP": true,
    "EDPMaxParallelism": 16,
    "EDPMinParallelism": 8
  },
  "EnabledDebugger": false,
  "Priority": 1,
  "SubStatus": "Restarting",
  "RestartTimes": "0/10",
  "StatusHistory": [
    {
      "Status": "",
      "StartTime": "",
      "EndTime": "",
      "ReasonCode": "",
      "ReasonMessage": ""
    }
  ],
  "TenantId": "GAR***W134",
  "ResourceType": "ECS",
  "CredentialConfig": {
    "EnableCredentialInject": true,
    "AliyunEnvRoleKey": "",
    "CredentialConfigItems": [
      {
        "Key": "",
        "Type": "",
        "Roles": [
          {
            "RoleArn": "",
            "RoleType": "",
            "AssumeRoleFor": "",
            "Policy": "",
            "AssumeUserInfo": {
              "SecurityToken": "",
              "AccessKeyId": "",
              "Type": "",
              "Id": ""
            }
          }
        ]
      }
    ]
  },
  "Accessibility": "PRIVATE",
  "RestartRecord": [
    {
      "DetailErrorInfoList": [
        {
          "AddJobLevelBlacklist": true,
          "AddNodeToBlacklist": true,
          "DetailErrorMsg": "",
          "ErrorCode": "",
          "ErrorMsg": "",
          "ErrorSource": "",
          "Node": "",
          "Pod": "",
          "TriggerRestart": true
        }
      ],
      "JobRestartCount": 0,
      "OccurPhase": "",
      "OccurTime": "",
      "Reason": "",
      "RestartDurationInSec": 0,
      "RestartFailReason": "",
      "RestartStatus": "",
      "TriggerID": ""
    }
  ],
  "JobReplicaStatuses": [
    {
      "Type": "",
      "Active": 0
    }
  ],
  "GmtFinishTime": "2021-01-12T15:36:08Z"
}

错误码

访问错误中心查看更多错误码。

变更历史

变更时间变更内容概要操作
2025-11-18OpenAPI 返回结构发生变更查看变更详情
2025-10-23OpenAPI 返回结构发生变更查看变更详情
2024-10-23OpenAPI 返回结构发生变更查看变更详情
2024-07-09OpenAPI 返回结构发生变更查看变更详情
2024-01-24OpenAPI 返回结构发生变更查看变更详情
2024-01-05OpenAPI 返回结构发生变更查看变更详情
2024-01-03OpenAPI 返回结构发生变更查看变更详情
2023-12-08OpenAPI 返回结构发生变更查看变更详情