批量新增离线数据同步任务

数据资源平台支持离线同步任务的批量创建,并支持一键启动多个上云任务,实现全量任务自动建表。本文以同步MySQL数据源到MaxCompute目标端为例,介绍如何批量新增离线数据同步任务。

前提条件

  • 已存在对应数据源,具体操作,请参见新建数据源

  • 已完成源端数据和目标端的物理表同步,具体操作,请参见获取物理表

  • 已添加离线数据同步任务目录,具体操作,请参见添加任务目录

操作步骤

  1. 登录数据资源平台控制台

  2. 在页面左上角,单击导航图标 图标,选择研发工作台

  3. 在顶部菜单栏,单击选择工作组图标,选择目标工作组,单击资产加工

    说明

    若您已在资产加工页面,请跳过“单击资产加工”的操作。

  4. 在左侧导航栏,单击数据同步图标,将鼠标悬停在离线数据同步上,单击image图标。

  5. 离线数据同步页面,单击批量新增任务

  6. 配置基本信息、数据元和目标端。

    1. 在配置向导页面,选择所属目录,输入任务的描述。

    2. 数据源配置区域,选择数据源类型。

    3. 数据对象的左侧区域勾选待同步的数据,单击 / />图标。数据源配置

    4. 目标端配置区域,配置目标端、分区信息、清理规则。配置目标端

    5. 配置完成后,单击下一步

  7. 配置任务调度。

    1. 配置任务调度区域,选择任务调度类型,配置调度信息。

      • 周期调度image..png

        参数

        说明

        任务调度类型

        选择周期调度

        生效日期

        调度将在有效日期内生效并自动调度,反之,在有效期外的任务将不会自动调度,也不能手动调度。

        调度周期

        全量和增量的调度周期均分为分钟,小时,日,周,月。

        • 分钟:设置间隔时间,指的是每隔多少分钟任务运行一次。

        • 小时:设置间隔时间和指定时间。

          • 间隔时间:指的是每隔多少小时任务运行一次。

          • 指定时间:任务在指定的时间点运行,可多选。

        • 日:设置运行的具体时间。

        • 周:选择每周星期几运行,并设置运行的具体时间,可多选。

        • 月:选择每月几号运行,并设置运行的具体时间,可多选。

        指定运行分钟

        调度周期选择小时的时候,设置任务在指定的时间点运行。

        优先级

        设置任务运行的优先级,可设置为中、高、低三个级别。

        请选择

        请设置任务运行相关配置,可多选。

        • 依赖上一周期:指定任务的上一个周期实例运行完成(包括正常完成和异常完成),才能运行下一个周期实例。

        • 运行异常,下线任务:当任务的实例运行异常时,自动将任务下线。

        • 开启任务预警:选中后,上线的同步任务将自动推送到监控运维的监控任务管理中。

        • 依赖同周期上游节点:选中后,通过选择工作组中的节点,设置同步任务的依赖节点。

        表结构变化

        选择是否开启检测表结构变化。开启后,以天为单位,进行数据源端表结构检测。若发现表结构变更,则进行异常推送。异常信息可在“运维监控 - 全景监控”中查看。

      • 一次性调度image..png

        参数

        说明

        任务调度类型

        选择一次性调度

        运行时间

        请设置任务运行时间。

        • 任务上线立即运行:即单击上线按钮立即运行。

        • 指定时间:在指定时间运行,支持力度到秒。

        优先级

        设置任务运行的优先级,可设置为中、高、低三个级别。

        表结构变化

        选择是否开启检测表结构变化。开启后,以天为单位,进行数据源端表结构检测。若发现表结构变更,则进行异常推送。异常信息可在“运维监控 - 全景监控”中查看。

    2. 单击展开高级配置,配置任务的资源规格、超时、速率。高级设置

      参数

      说明

      资源规格

      请设置任务实例运行需要的CPU内核(系统默认2个)与内存(系统默认1024 MB)。

      超时自动终止

      选中后,可配置超时和超时自动重试。

      • 超时:超过该时间,任务停止运行。

        • 周期为时间间隔类型,默认值为3倍间隔时间。

        • 周期为定时类型,默认值为24小时。

      • 超时自动重试: 默认重试0次。

        重要

        超时自动重试配置为1次及以上,且任务运行时间超过配置的超时后,任务将被系统强行终止,请谨慎配置。

      速率

      设置任务的速率上限,任务运行会尽可能达到该速度但是不是超过它。

      • 通道(个):通道数量上限, 即并发线程数量上限。

      • 字节(byte/s)/通道:每个通道每秒传输的字节流上限。

      • 记录(条/s)/通道:每个通道每秒传输的记录数上限。

      说明

      字节流和记录数2个上限,谁先达到,谁先起作用。

    3. 操作完成后,单击下一步

  8. review任务区域,对任务进行检视。

    • 单击编辑,可对同步任务的基本信息、目标端、字段映射、任务调度进行修改。

    • 单击删除,可删除某条同步任务。

  9. 单击提交,在提示对话框中单击确定

后续步骤

批量新增同步任务后,需要对任务进行上线操作,具体操作,请参见上线离线数据同步任务

阿里云首页 数据资源平台 相关技术圈