全部产品
大数据开发套件

步骤5:配置数据导入任务

更新时间:2017-09-20 19:04:45   分享:   

原始数据在 RDS 数据库上,若想通过 MaxCompute 对数据进行加工、分析,需要先把数据导入到 MaxCompute 中。前文中已成功 配置 RDS 数据源创建 MaxCompute 表,接下来即可开始创建数据导入任务。

操作步骤

  1. 打开创建的工作流(tmall_ub_features_demo),将数据同步节点组件拖拽至画布中。

    1

    • 名称:s_user_brand_demo。

    • 描述:RDS 上同步数据到表 s_user_brand_demo。

  2. 双击该节点或右键查看节点内容进入任务配置界面。

    1. 选择来源。

      1

      源头默认为单表,选择前面添加的数据源,和对应的原始数据表。

    2. 选择目标。

      1

      目标选择本项目对应的 MaxCompute project,所以数据源为 odps_frist,目标表为 s_user_brand_demo 表。

    3. 字段映射。

      选择要抽取的列,并映射到目标表字段。

      1

      选好源和目标表之后,列会先自动按照字段名对应匹配,匹配不到的目标字段留空,默认显示所有源表字段,数据同步任务执行的时候就按该字段配置顺序一一对应读写。

    4. 通道控制。

      1

    5. 完成以上配置后,单击 保存

  3. 配置节点参数。

    由于 ${bdp.system.bizdate} 为系统参数,因此参数配置中无需赋值。

  4. 单击 保存

后续步骤

现在,您已经学习了如何配置数据同步任务,您可以继续学习下一个教程。在该教程中您将学习如何配置 SQL 任务,产出结果表。详情请参见 配置 SQL 任务产出特征表

本文导读目录
本文导读目录
以上内容是否对您有帮助?