DataWorks的数据对比节点可实现对不同表之间的数据进行多种方式的对比,并可在工作流中使用。本文为您介绍使用数据对比节点进行任务开发的主要流程。
节点介绍
数据对比节点不仅仅是数据集成使用,支持表与表之间的对比。同时还支持进行自定义对比范围以及自定义对比的指标,从而实现更多方面的数据对比。
条件限制
仅支持Serverless资源组,使用Serverles资源组可参见:资源组管理。
操作步骤
步骤一:新建数据对比节点
进入数据开发页面。
登录DataWorks控制台,切换至目标地域后,单击左侧导航栏的 ,在下拉框中选择对应工作空间后单击进入数据开发。
单击图标,选择
。根据界面指引,输入节点的路径、名称等信息。
步骤二:配置数据对比节点
配置对比表信息
数据对比节点只需通过简单配置对比表信息,即可对不同数据源的表数据进行对比,配置详情可参见以下表格:
参数 | 说明 |
资源组 | 下拉选择已有资源组。 |
任务资源占用 | 调整数据对比节点运行的资源占用量。 |
数据源类型 | 选择需要进行对比的来源表和目标表的数据源类型。 |
数据源名称 | 选择需要进行对比的来源表和目标表的数据源。 |
连通性 | 配置完成后,单击测试查看数据源是否与资源组连通。 |
表名 | 下拉选择需要进行来源表和目标表。 |
Where筛选 | 对需要进行对比的来源表和目标表进行过滤。 |
切分键 | 为来源表配置切分键,以将数据表中某一列作为切分键,建议使用主键或有索引的列作为切分键。 |
配置对比规则
对比规则可以进行指标对比或全文对比,从而实现对来源于目标按照不同的对比规则进行对比。
调度配置
完成规则配置后,即可对数据对比节点进行调度配置,配置详情可参见:任务调度配置。
步骤三:发布与运维
发布数据对比节点
节点任务配置完成后,需执行提交发布操作,提交发布后节点将根据调度配置内容进行周期性运行。
单击工具栏中的图标,保存节点。
单击工具栏中的图标,提交节点任务。
提交时需在提交对话框中输入变更描述,并根据需要选择是否在节点提交后执行代码评审及冒烟测试。
如您使用的是标准模式的工作空间,任务提交成功后,还需单击节点编辑页面右上方的发布,将该任务发布至生产环境执行,操作请参见发布任务。
运维数据对比节点
数据对比节点发布成功后,可在运维中心内对该节点进行运维操作,详情可参见:运维中心。
查看数据校验报告
数据校验报告可在任务运行日志中查看,可通过以下方式进行查看:
运维中心查看:
单击按钮,选择
进入运维中心。在运维中心左侧导航栏单击进入
查看数据对比节点生成实例,并右键查看日志。在日志页面单击数据校验页签即可查看。
运行日志查看:
若仅在数据开发页面对数据对比节点运行,可在数据开发页面单击如下图链接,将跳转至数据校验报告页面。