全部产品
大数据开发套件

创建工作流

更新时间:2017-06-07 13:26:11   分享:   

分析本示例,数据流程如下图:

tm_demo_dataflow.JPG

源表经过加工成为两个中间表,最后通过两个中间表加工得出目标表,一个工作流可以完成。同时前面“数据准备”章节中分析得出需要创建日分区表,也就是每日一分区因此工作流相应的配置为周期性天调度。具体操作步骤如下:

步骤1:以开发者身份进入阿里云数加平台>大数据开发套件>管理控制台,点击对应项目操作栏中的进入工作区

步骤2:创建工作流文件目录“天猫品牌推荐模型”。

步骤3:目录文件夹上新建新建任务>工作流任务,或右边工作区点击 新建任务>工作流任务

步骤4:在新建工作流弹出框中填写各配置项。

新建工作流弹出框中配置项如下:

■ 任务类型:选择工作流任务。

■ 名称:tmall_ub_features_demo。

■ 描述:天猫品牌推荐模型之用户-品牌所有特征表产出工作流。

■ 调度类型:选择周期调度,后续工作流才可以配置调度周期。

■ 选择目录:选择前面创建的目录“天猫品牌推荐模型”。

步骤5:点击创建

步骤6:点击右侧导航栏的调度配置进行配置。

步骤6.1:基本属性无需修改。

步骤6.2:因为工作流需要周期调度,且目前没有预设下线时间,因此所有配置项保留默认。

调度周期为天,具体时间为0点整即每日0点调度服务开始调度当天示例时即可开始调度此工作流。

步骤6.3:依赖属性源头数据导入也打算直接在本工作流中配置任务,没有什么必须依赖的上游工作流,所以此配置保持不变。

步骤6.4:跨周期依赖可根据自己的需求进行相应的配置。

>>>下一步:配置数据导入任务>>>

本文导读目录
本文导读目录
以上内容是否对您有帮助?