使用DataWorks离线调度Studio实验
离线调度功能是机器学习的常见场景,您需要通过离线调度功能周期性地更新模型,帮助您构建模型训练的Pipeline。PAI Studio支持与DataWorks互通,实现Studio实验的周期性调度。本文为您介绍如何使用DataWorks实现Studio实验的离线调度。
背景信息
实验的所有节点都运行成功后,您可以部署整个实验流程至离线调度,定时运行。说明 离线调度节点前,请确保实验中的所有节点已运行成功,并且已开通DataWorks服务。详情请参见创建工作空间。
操作步骤
- 进入PAI-Designer页面。
- 登录PAI控制台。
- 在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。
- 在工作空间页面的左侧导航栏选择 ,进入Designer页面。
- 在可视化建模(Designer)页面右上方,单击前往旧版可视化建模(Studio)。
- 双击打开相应的实验(示例为心脏病预测案例)。
- 在实验的编辑页面,单击 ,进入DataWorks数据开发页面。
- 创建一个PAI Studio节点。
- 在新建节点对话框中,选择节点类型为PAI Studio,并选择路径。如果未在弹出的对话框中直接创建,您也可以在数据开发页面,鼠标悬停至新建,单击新建节点。说明 节点名称必须是大小写字母、中文、数字、下划线(_)和小数点(.),且不能超过100个字符。
- 单击提交。
- 在新建节点对话框中,选择节点类型为PAI Studio,并选择路径。
- 在节点的编辑页面,从选择PAI Studio实验下拉列表中选择已创建的PAI Studio实验。如果您需要修改PAI Studio实验,请单击去PAI Studio编辑,进入实验编辑页面进行编辑。
- 单击节点编辑区域右侧的调度配置,配置节点的调度属性,详情请参见调度配置。配置调度参数,主要配置调度周期和节点输入输出等参数。
- 保存并提交节点。重要 您需要设置节点的重跑属性和依赖的上游节点,才可以提交节点。
- 单击工具栏中的
图标,保存节点。
- 单击工具栏中的
图标。
- 在提交新版本对话框中,输入变更描述,并单击确定。
如果您使用的是标准模式的工作空间,提交成功后,请单击右上方的任务发布,具体操作请参见发布任务。 - 单击工具栏中的
- 单击页面右上方的运维中心,查看机器学习任务的运行情况和操作日志。您也可以直接进行补数据、实验试跑等操作,详情请参见查看并管理周期任务。