本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。
DataX任务类型,用于执行DataX程序。本文为您介绍创建DataX类型任务时涉及的参数。
参数说明
参数 | 说明 |
节点名称 | 任务的名称。一个工作流定义中的节点名称是唯一的。 |
运行标志 |
|
描述 | 节点的描述。 |
任务优先级 | 流程运行的优先级。支持以下级别:
|
失败重试次数 | 工作流运行失败自动重试的次数。 |
失败重试间隔 | 每次失败重试的间隔。单位:分。 |
延时执行时间 | 延时执行时间,默认为0,即立即执行,设置了该值后才执行延时操作。单位:分。 |
超时告警 | 该开关默认关闭。打开超时告警开关,可设定超时时长,并选择至少一个超时策略。
|
任务提交节点 | 仅支持EMR集群worker节点(提交到Yarn执行),表示任务在EMR集群的Worker节点提交,占用一个YARN Container。 警告 该模式会直接影响EMR集群的文件系统或运行环境,请谨慎操作。 使用该模式,您还可以选择配置以下参数:
|
自定义DATAX作业配置(JSON) | 默认关闭,启用该参数后,还需配置DATAX作业配置(JSON),编写JSON格式的配置文件。 |
数据源类型 | 选择抽取数据的数据源类型。 |
数据源实例 | 选择在数据源中心中创建的数据源。 |
数据源筛选SQL | 从数据源中抽取数据的SQL语句。当节点执行SQL时会自动解析SQL查询的列名,并将其映射为目标表的同步列名。当源表和目标表的列名不一致时,可以通过使用列别名(AS)来进行转换。 |
目标源类型 | 选择同步数据的数据源类型。 |
目标源实例 | 选择在数据源中心中创建的目标数据源,以同步数据。 |
目标表 | 选择同步数据的表。 |
目标库前置SQL(preSql) | SQL语句执行前,执行前置SQL。 |
目标库后置SQL(postSql) | SQL语句执行完成后,执行后置SQL。 |
限流(字节数) | 限制查询结果返回的字节数量。 |
限流(记录数) | 限制查询结果返回的记录数量。 |
自定义参数 | 任务自定义参数,会替换脚本中 |
前置任务 | 设置当前任务的前置(上游)任务。 |