本文为您介绍如何在调度任务中,自动同步PAI模型至OSS。
前提条件
在开始执行操作之前,请确认您已经完成以下准备工作:
已完成OSS访问授权,详情请参见云产品依赖与授权:Designer。
自动同步Designer模型至OSS
登录PAI控制台,并进入Designer中已创建的工作流页面。
以创建心脏病预测案例为例,创建及进入工作流页面的操作详情请参见心脏病预测。
在工作流属性页签,将工作流数据存储参数配置为模型保存的OSS路径。
选中模型组件(例如逻辑回归二分类),在右侧的字段设置页签,选中是否生成PMML复选框。
说明如果模型组件不支持导出PMML格式的模型文件,则可以跳过该步骤,执行步骤4。
在模型组件的下游接入通用模型导出组件。
您可以通过通用模型导出组件来指定导出模型文件的名称。每次执行调度任务后,都会在上述步骤配置的OSS路径下,保存一个同名的模型文件。
使用DataWorks实现Designer工作流的离线调度。具体操作,请参见使用DataWorks离线调度Designer工作流。
如果您希望每次执行调度任务后,均生成一个不同名称的非临时模型文件,可以使用全局变量并结合定时调度参数来实现,具体请参见高级功能:全局变量。例如,将日调度的模型名配置为test_model_${date}。将date参数在DataWorks调度配置中替换为$bizdate即可。每次执行调度任务后,都会生成以时间结尾的模型文件,例如:test_model_20220920。
相关文档
Designer预置了多种算法组件,你可以根据不同的使用场景选择合适的组件进行模型训练,详情请参见组件参考:所有组件汇总。
Designer为您提供了丰富的工作流模板,您可以直接套用模板快速构建模型,详情请参见Designer使用案例汇总。
文档内容是否对您有帮助?