JobSpec

名称类型描述示例值
object

描述一种类型的 Worker 的详细配置,包括硬件规格,运行镜像,副本数量等。

Typestring

Type 与 Job Type 紧密相关,不同 Job Type 支持不同的 Worker Type。

  • TFJob:支持 Chief, PS, Worker, Evaluator, GraphLearn。

  • PyTorchJob: 支持 Worker, Master。

  • XGBoostJob: 支持 Worker, Master。

  • OneFlowJob:支持 Worker, Master。

  • ElasticBatch:支持 Worker, Master。

PyTorchJob、XGBoostJob、OneFlowJob 和 ElasticBatch 中的 Master 是可选的,若未指定,系统会自动将第一个 Worker 节点作为 Master。

Worker
Imagestring

此类 Worker 的运行镜像地址,可以调用 ListImages 获取 PAI 平台提供的镜像。也可以指定第三方公开的镜像。

registry-vpc.cn-hangzhou.aliyuncs.com/cloud-dsw/tensorflow:1.12PAI-gpu-py36-cu101-ubuntu18.04
ImageConfigImageConfig

私有镜像配置。

PodCountlong

副本数量。

1
EcsSpecstring

Worker 的硬件规格,请访问PAI-DLC 计费说明获取详细规格列表。

注意 不同规格的价格会有区别。

ecs.c6.large
ExtraPodSpecExtraPodSpec

额外的 Pod 配置。

ResourceConfigResourceConfig

资源配置。

UseSpotInstanceboolean

是否使用竞价实例。

false
SpotSpecSpotSpec

抢占式实例配置。

AssignNodeSpecAssignNodeSpec

指点调度节点配置。