全部产品

通用数据结构

CodeSourceItem

一个CodeSource的描述,用于ListCodeSources

参数名称

类型

示例值

描述

CodeSourceId

String

code-20210111103721-********

代码源ID

DisplayName

String

MyCodeSourceName1

代码源名称

Description

String

code source of dlc examples

代码源详细文字描述

CodeRepo

String

https://code.aliyun.com/pai-dlc/examples.git

代码仓库地址

CodeBranch

String

master

代码仓库分支;在CreateJob时可以被覆盖。

CodeCommit

String

44da109b59f8596152987eaa8f3b2487bb72ea63

代码CommitID,调用CreateJob时可以覆盖。

CodeRepoUserName

String

user

代码仓库访问的用户名,用于访问私有仓库。

CodeRepoAccessToken

String

xxxx

访问代码仓库的AccessToken。

UserId

String

115729017166****

代码源创建者的阿里云用户UID。

GmtCreateTime

String

2021-01-18T12:52:15Z

创建时间(UTC)

GmtModifyTime

String

2021-01-18T12:52:15Z

修改时间(UTC)

DataSourceItem

数据源详情

参数名称

类型

示例值

描述

DataSourceType

String

nas

数据源类型,仅支持nas;其他类型正在添加中,敬请期待。

DataSourceId

String

data-20210114104214-xxxxxxx

数据源ID

DisplayName

String

nas-data

数据源名称

Description

String

data source of dlc examples

数据源详细描述

FileSystemId

String

1ca404****

阿里云NAS文件系统ID,请参考阿里云文档

MountPath

String

/root/data/

挂载到任务运行时的容器的本地路径

UserId

String

123456789

数据源创建者的阿里云用户ID

GmtCreateTime

String

2021-01-12T14:35:00Z

创建时间(UTC)

GmtModifyTime

String

2021-01-12T14:36:00Z

最后修改时间(UTC)

ImageItem

Docker Image详情

参数名称

类型

示例值

描述

ImageTag

String

tensorflow-training:2.3-cpu-py36-ubuntu18.04

Docker镜像的Tag

ImageUrl

String

registry.cn-beijing.aliyuncs.com/pai-dlc/tensorflow-training:2.3-cpu-py36-ubuntu18.04

镜像URL地址

ImageUrlVpc

String

registry-vpc.cn-beijing.aliyuncs.com/pai-dlc/tensorflow-training:2.3-cpu-py36-ubuntu18.04

镜像URL的阿里云VPC地址,访问速度更快。

ImageProviderType

String

Community

镜像类型,枚举值:

  • Community: 社区
  • PAI: PAI平台优化

AcceleratorType

String

gpu

镜像加速器类型,枚举型:

  • cpu
  • gpu

Framework

String

PyTorchJob

镜像封装的计算框架,枚举型:

  • TFJob
  • PyTorchJob

JobItem

作业详情信息

参数名称

类型

示例值

描述

JobId

String

dlc-20210126170216-********

作业ID

JobType

String

TFJob

作业类型

DisplayName

String

tf-mnist-test

作业名称

UserId

String

123456789

作业所属用户的UID

Status

String

Stopped

作业状态

ReasonCode

String

JobStoppedByUser

作业进入当前状态的缘由Code

ReasonMessage

String

Job is stopped by user.

作业进入当前状态的缘由详细描述

JobSpecs

Array of JobSpec

作业运行时的节点配置

UserCommand

String

python /root/code/mnist.py

作业每个节点运行的启动命令

DataSources

Array of DataSources

本作业使用的所有数据源配置列表

DataSourceId

String

data-20210114104214-********

数据源配置ID

CodeSource

Object

次作业使用的代码源配置

CodeSourceId

String

code-20210111103721-********

代码源配置ID

Branch

String

master

代码仓库分支

Commit

String

44da109b59f8596152987eaa8f3b2487bb******

此次作业使用的代码仓库的CommitID

ThirdpartyLibs

Array of String

numpy==1.16.1

一个Python三方库

ThirdpartyLibDir

String

/root/code/

三方库文件Requirements.txt所在目录。

Envs

Map

作业运行时被注入的环境变量

GmtCreateTime

String

2021-01-12T14:35:01Z

作业创建时间, UTC

GmtFinishTime

String

2021-01-12T15:36:08Z

作业结束时间,UTC

Duration

Long

3602

作业运行时长,单位:秒

JobSpec

描述一种类型的Worker的详细配置,包括硬件规格,运行镜像,副本数量等。

参数名称

类型

示例值

描述

Type

String

Worker

Type与Job Type紧密相关,不同Job Type支持不同的Worker Type。

  • TFJob:Chief, PS, Worker, Master

  • PyTorchJob: Worker, Master

Image

String

registry.cn-hangzhou.aliyuncs.com/pai-dlc/tensorflow-training:1.12.2PAI-cpu-py27-ubuntu16.04

此类Worker的运行镜像地址,可以调用 ListImages 获取PAI平台提供的社区和PAI优化过的镜像。也可以指定第三方公开的镜像。

PodCount

Long

1

副本数量。

EcsSpec

String

ecs.c6.large

Worker的硬件规格,请访问 PAI-DLC计费说明 获取详细规格列表。请注意,不同规格的价格会有区别。

Metric

监控指标。

参数名称

类型

示例值

描述

Time

Long

1616987726587

时间戳(Unix Timestamp),单位为毫秒。

Value

Float

23.45

监控数据的值。

PodMetric

任务监控数据。

参数名称

类型

示例值

描述

PodId

String

dlc-20210329110128-******-worker-0

节点ID。

Metrics

Array of Metric

监控数据列表。