离线调度功能是机器学习的常见场景,您需要通过离线调度功能周期性地更新模型,帮助您构建模型训练的Pipline。机器学习支持与DataWorks互通,实现机器学习实验的周期性调度。

背景信息

实验的所有节点都运行成功后,您可以部署整个实验流程至离线调度,定时运行。
说明 离线调度节点前,请确保实验中的所有节点已运行成功,并且已开通DataWorks服务。详情请参见创建工作空间

操作步骤

  1. 进入机器学习的实验页面。
    1. 登录PAI Console
    2. 在左侧导航栏,单击模型开发和训练 > Studio-可视化建模,进入PAI可视化建模页面。
      创建项目时,建议您使用按量付费模式(后付费),并开启GPU,PAI-TF任务只能在GPU资源中运行。PAI-Studio
    3. 单击目标项目操作列的进入机器学习
    4. 双击打开相应的实验(示例为心脏病预测案例)。
  2. 在实验的编辑页面,单击部署 > 实验离线调度,进入DataWorks数据开发页面。
    离线
  3. 创建一个机器学习节点。
    1. 新建节点对话框中,输入节点名称,并选择目标文件夹
      如果未在弹出的对话框中直接创建,您也可以在数据开发页面,鼠标悬停至新建图标,单击算法 > 机器学习(PAI)
      说明 节点名称必须是大小写字母、中文、数字、下划线(_)和小数点(.),且不能超过128个字符。
    2. 单击提交
  4. 在节点的编辑页面,从选择机器学习实验下拉列表中选择已创建的机器学习实验。
    如果您需要修改机器学习实验,请单击去机器学习编辑,进入实验编辑页面进行编辑。选择实验
  5. 单击节点编辑区域右侧的调度配置,配置节点的调度属性,详情请参见基础属性
    配置调度参数,主要配置调度周期和节点输入输出等参数。调度配置
  6. 保存并提交节点。
    注意 您需要设置节点的重跑属性依赖的上游节点,才可以提交节点。
    1. 单击工具栏中的保存图标,保存节点。
    2. 单击工具栏中的提交图标。
    3. 提交新版本对话框中,输入变更描述
    4. 单击确认
    如果您使用的是标准模式的工作空间,提交成功后,请单击右上方的发布。具体操作请参见发布任务
  7. 单击页面右上方的运维,查看机器学习任务的运行情况和系统日志。
    您也可以直接进行补数据、实验试跑等操作。详情请参见查看周期任务