如何在调度任务中自动同步PAI模型至OSS

本文为您介绍如何在调度任务中,自动同步PAI模型至OSS。

前提条件

在开始执行操作之前,请确认您已经完成以下准备工作:

自动同步Designer模型至OSS

  1. 登录PAI控制台,并进入Designer中已创建的工作流页面。

    以创建心脏病预测案例为例,创建及进入工作流页面的操作详情请参见心脏病预测

  2. 工作流属性页签,将工作流数据存储参数配置为模型保存的OSS路径。

  3. 选中模型组件(例如逻辑回归二分类),在右侧的字段设置页签,选中是否生成PMML复选框。

    说明

    如果模型组件不支持导出PMML格式的模型文件,则可以跳过该步骤,执行步骤4。

  4. 在模型组件的下游接入通用模型导出组件。

    您可以通过通用模型导出组件来指定导出模型文件的名称。每次执行调度任务后,都会在上述步骤配置的OSS路径下,保存一个同名的模型文件。

  5. 使用DataWorks实现Designer工作流的离线调度。具体操作,请参见使用DataWorks离线调度Designer工作流

    如果您希望每次执行调度任务后,均生成一个不同名称的非临时模型文件,可以使用全局变量并结合定时调度参数来实现,具体请参见高级功能:全局变量。例如,将日调度的模型名配置为test_model_${date}重命名date参数在DataWorks调度配置中替换为$bizdate即可。参数配置每次执行调度任务后,都会生成以时间结尾的模型文件,例如:test_model_20220920。

相关文档

  • Designer预置了多种算法组件,你可以根据不同的使用场景选择合适的组件进行模型训练,详情请参见组件参考:所有组件汇总

  • Designer为您提供了丰富的工作流模板,您可以直接套用模板快速构建模型,详情请参见Designer使用案例汇总