您可以通过命令行工具的方式提交PAI-DLC专有资源组任务。本文介绍如何通过命令行工具提交使用专有DLC资源组的训练任务,核心步骤包括下载客户端并执行用户认证、创建并提交任务。

前提条件

下载客户端并执行用户认证

根据您使用的操作系统下载Linux 64或Mac版本的客户端工具并完成用户认证,具体操作请参见准备工作

创建并提交任务

  1. 登录PAI控制台
  2. 按照下图操作指引,在工作空间列表页面查看您所在的工作空间ID(WorkspaceID)。
    查询工作空间ID
  3. 按照下图操作指引,在PAI-DLC页面查看您的专有资源组的资源组ID。
    专有资源组ID
  4. 参考以下文件内容准备参数文件 ./tfjob.params。关于命令行使用方式,详情请参见命令列表
    name=test_cli_tfjob_001
    workers=1
    worker_cpu=4
    worker_gpu=0
    worker_memory=4Gi
    worker_shared_memory=4Gi
    worker_image=registry-vpc.cn-beijing.aliyuncs.com/pai-dlc/tensorflow-training:1.12.2PAI-cpu-py27-ubuntu16.04
    command=echo good && sleep 120
    resource_id=<您的资源组ID> # 如果您使用公共资源组,该参数允许为空。
    workspace_id=<您的WorkspaceID>
  5. 使用以下代码示例传入params_file参数创建并提交任务,可以将PAI-DLC任务提交到指定的工作空间和专有资源组
    dlc submit tfjob --job_file  ./tfjob.params
  6. 使用以下代码查看您提交的PAI-DLC任务。
    dlc get job <jobID>