提交离线任务至DLC
PAI DSW支持在JupyterLab中快速创建离线训练任务,把您开发的Notebook或Python代码提交到通用训练资源组进行离线训练。本文为您介绍如何使用JupyterLab提交离线训练任务。
前提条件
已创建NAS类数据集,详情请参见创建及管理数据集。
已创建DSW实例,并关联NAS类数据集, 详情请参见创建及管理DSW实例。
已完成DLC相关权限授权,详情请参见云产品依赖与授权:DLC。
操作步骤
进入DSW开发环境。
登录PAI控制台。
在页面左上方,选择使用服务的地域。
在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。
在左侧导航栏,选择模型开发与训练 > 交互式建模(DSW)。
在实例表格操作列,单击打开。
新建Notebook或Python文件。
在顶部菜单栏中选择JupyterLab。
在Launcher页面中,选择创建Notebook或Python文件。
右键单击Notebook或Python文件,在下拉菜单中单击DLC离线运行。
在新建任务页面,配置如下训练任务的参数。
其中以下参数会自动填写,其他参数配置,详情请参见提交任务。
节点镜像: 当前实例最近一次保存的镜像。
数据集配置: 默认选中当前实例关联的NAS/OSS数据集。
执行命令: 根据当前选中的文件类型,生成相应的执行命令。
notebook 文件, 执行命令为
jupyter nbconvert --execute *.ipynb --to notebook
, jupyter 程序已提前安装在实例镜像中。如果“节点镜像” 选择了非实例镜像的其他选项,请取消注释# pip install nbconvert ipykernel
。python 文件, 执行命令为
python *.py
。
在左侧工具栏单击JOB图标, 查看所有已提交任务的状态。
(可选)使用Tensorboard服务。
在Tensorboard页签, 单击新建Tensorboard。
在新建Tensorboard对话框,配置以下参数,并单击提交。
数据集配置: 选择当前DSW所关联的NAS数据集。
Summary相对目录: tf_logs日志目录的相对路径。例如:日志目录的路径是/mnt/data/tf_logs,则相对路径是/tf_logs 。
后续您可以在JupyterLab的Launcher页面,快速开始使用Tensorboard服务。