本文介绍如何利用PAI-DLC基于PyTorch进行离线迁移学习的训练。

步骤一:准备数据

本文使用的数据已经预存到公开地址(下载数据),您无需进行额外的数据准备。

步骤二:准备训练代码和模型存储文件

本文使用的训练代码已经预存到公开地址(下载训练代码),您无需进行额外的代码开发。

步骤三:创建任务

  1. 进入PAI-DLC Dashboard。
    1. 登录PAI控制台
    2. 在左侧导航栏,选择模型开发和训练 > 云原生深度学习训练(DLC)
    3. 在PAI-DLC管理控制台页面,找到类型公共资源组的工作集群,单击操作列下的集群控制台
  2. 在左侧导航栏,选择新建 > 新建任务
  3. 新建任务页面,仅配置如下参数,其他参数无需配置。
    配置任务参数
    参数 描述
    任务名称 填写任务名称,例如torch-sample
    任务类型 选择Pytorch单机
    执行命令 填写如下命令,其中包括了下载数据、下载代码、执行训练任务及检查模型的步骤。
    wget https://pai-public-data.oss-cn-beijing.aliyuncs.com/hol-pytorch-transfer-cv/data.tar.gz && tar -xf ./data.tar.gz && mv ./hymenoptera_data/ ./input && mkdir output && wget https://pai-public-data.oss-cn-beijing.aliyuncs.com/hol-pytorch-transfer-cv/main.py && python main.py -i ./input -o ./output && ls ./output
    节点镜像 单击PAI平台镜像,并在下方的列表中选择PyTorch镜像。
    节点配置 选择ecs.gn6e-c12g1.3xlarge
  4. 单击提交

步骤四:查看任务详情和日志结果

  1. 在PAI-DLC Dashboard的左侧导航栏,单击任务列表
  2. 任务列表页面,单击任务的名称任务名称
  3. 任务详情页面,即可查看任务的基本信息任务配置等信息。任务详情
  4. 任务详情页面底部的实例区域,单击目标实例操作列下的日志,即可查看日志结果。日志结果