周期任务补数据功能用于对周期任务在指定的历史业务日期内进行数据回刷。周期任务开发完成并提交发布后,任务会按照调度配置定时运行,如果您希望在指定时间段运行周期任务或回刷历史一段时间区间的数据,可以使用补数据功能。节点使用的调度参数会根据补数据选择的业务时间自动替换成对应的值。本文为您介绍如何对周期任务进行补数据。
应用场景
补数据功能多用于以下应用场景:
新开发的周期任务,只能从第二天开始调度。如果您需要马上查看历史分区数据,可以执行补数据操作。
上游依赖的任务重跑或补数据导致历史分区数据刷新。您可以通过补数据功能,回刷下游任务的历史分区数据。
业务的历史数据存在遗漏,需要定时回刷历史数据。
补数据模式
当前,运维中心补数据功能支持对当前任务和对当前任务及下游任务进行补数据,详细说明如下:
补当前任务:即当前任务,用于对当前任务进行补数据操作。适用于以下场景:
对当前节点进行数据回刷,而无需更新下游节点数据。
当前任务计算逻辑变更,您可以先对当前任务进行补数据验证计算逻辑正确性,再对下游任务进行数据回刷。
补当前及下游任务:即当前任务及下游任务,适用于对全链路数据进行刷新的场景。
补数据操作入口
在Dataphin首页,单击顶部菜单栏的研发。
按照下图操作指引,选择相应的补数据模式,对周期任务进行补数据。
说明补数据操作也支持在周期任务的DAG图中进行补数据。更多信息,请参见周期任务DAG图。
对当前任务补数据
参数 | 描述 |
基本信息 | |
补数据实例名称 | 系统自动生成,命名格式为节点名称_运行日期_实例化编号,您也可以进行手动更改。 |
选择字段 | 如果您为明细及汇总表任务补数据,则需要选择补数据的字段。 详细说明如下:
|
运行配置 | |
运行时间 | 支持立即运行或自定义运行。 立即运行:完成配置后,立即生成补数据实例进行补数据任务。 自定义:自定义指定补数据实例运行时间点,补数据实例将在自定义的时间开始调度。 说明
|
业务日期 | 选择需要进行补数据的业务日期区间,根据任务的调度周期配置业务日期,详细说明如下:
|
高级配置 | |
单实例补数据 | 仅支持事实逻辑表进行选择。 可通过一个补数据实例同时覆盖更新本事件事实逻辑表所有选定日期(区间范围内)的数据,相比普通多实例并发补数据,可以节约计算资源,大幅减少补数据时间。 |
并发运行组数 | 并发运行组数用于控制同时有多少个补数据进程在运行。您可以选择并发运行的组数,系统支持最少并发运行1组,最多并发运行12组。
|
补数据顺序 | 可选择根据业务时间正序或倒序进行补数据。 说明 所选节点中存在跨周期依赖、自依赖时不支持业务日期倒序补数据。 |
暂停调度任务对应实例 | 配置暂停调度的任务生成的补数据实例的运行状态:
|
空跑调度任务对应实例 | 配置空跑调度的任务生成的补数据实例的运行状态: 空跑:若选择空跑,则选中的空跑调度任务生成的补数据实例将直接空跑成功。 正常运行:空跑状态的任务生成的补数据实例均正常运行。 |
对当前及下游任务补数据
参数 | 描述 |
基本信息 | |
补数据实例名称 | 系统自动生成,命名格式为节点名称_运行日期_实例化编号,您也可以进行手动更改。 |
选择字段 | 如果您为明细及汇总表任务补数据,则需要选择补数据的字段。 详细说明如下:
|
补数据范围 | |
下游任务选择 | 支持通过列表模式和海量模式选择需要补数据的下游任务: 说明 若起点任务是逻辑表,下游任务展示范围取决于选中需要补数据的逻辑表字段。
|
运行配置 | |
运行时间 | 支持立即运行或自定义运行。 立即运行:完成配置后,立即生成补数据实例进行补数据任务。 自定义:自定义指定补数据实例运行时间点,补数据实例将在自定义的时间开始调度。 说明
|
业务日期 | 选择需要进行补数据的业务日期区间,根据任务的调度周期配置业务日期,详细说明如下:
|
高级配置 | |
并发运行组数 | 并发运行组数用于控制同时有多少个补数据进程在运行。您可以选择并发运行的组数,系统支持最少并发运行1组,最多并发运行12组。
|
补数据顺序 | 可选择根据业务时间正序或倒序进行补数据。 说明 所选节点中存在跨周期依赖时不支持按业务日期倒序补数。 |
本节点是否空跑 | 选择本任务是否需要空跑:
|
暂停调度任务对应实例 | 配置暂停调度的任务生成的补数据实例的运行状态:
|
空跑调度任务对应实例 | 配置空跑调度的任务生成的补数据实例的运行状态:
|
小时区间影响范围 | 如果是小时、分钟任务,则还需要配置生效范围:
|
后续步骤
补数据操作提交后,您可以对补数据实例进行运维管理,例如查看运行日志、查看节点代码、终止实例运行等操作。更多信息,请参见补数据实例运维概述。
- 本页导读 (0)