全部产品
存储与CDN 数据库 安全 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网
DataWorks(数据工场)

步骤4:创建工作流

更新时间:2017-11-08 15:32:55

本示例中,数据的分析流程如下图所示:

tm_demo_dataflow.JPG

源表经过加工成为两个中间表,最后通过两个中间表加工得出目标表,一个工作流即可完成。同时,在 数据准备 中分析得出需要创建日分区表,也就是每日一分区。因此工作流需配置为周期性天调度。

操作步骤

  1. 以开发者身份进入 DataIDE 管理控制台,单击对应项目操作栏中的 进入工作区。

  2. 单击顶部导航栏中的 数据开发,导航至 新建 > 新建任务

  3. 填写弹出框中的各配置项,指定任务类型为 工作流任务。如下图所示:

    1

  4. 单击 创建

  5. 进入工作流页面后,单击右侧导航栏的 调度配置 进行配置。

    • 基本属性无需修改。

      1

    • 调度属性保留默认配置。

      因为工作流需要周期调度,且目前没有预设下线时间,因此所有配置项保留默认。

      1

      调度周期为天,具体时间为 0 点整,即每日 0 点调度服务开始调度当天示例时,即可开始调度此工作流。

    • 依赖属性保留默认配置。

      因为源头数据导入后,打算直接在本工作流中配置任务,没有必须依赖的上游工作流,所以此配置保持不变。

    • 跨周期依赖可根据自己的需求进行相应的配置。

      1

后续步骤

现在,您已经学习了如何创建工作流,您可以继续学习下一个教程。在该教程中您将学习如何通过创建同步任务来把数据导入到 MaxCompute 中。详情请参见 配置数据导入任务

本文导读目录