配置Kudu输出组件后,可以将其他数据源的数据写入Kudu数据源。本文为您介绍如何配置Kudu输出组件。
前提条件
在开始执行操作前,请确认您已完成以下操作:
Kudu数据源的创建,详情请参见创建Kudu数据源。
进行Kudu输出组件属性配置的账号,需具备该数据源的同步写权限。如果没有权限,则需要申请数据源权限,详情请参见申请、续期和交还数据源权限。
操作步骤
参见离线管道组件开发入口,进入离线单条管道脚本的开发页面。
在离线单条管道脚本的开发页面,按照下图操作指引,进入Kudu输出配置对话框。
在Kudu输出配置对话框,配置参数。
参数
描述
步骤名称
Dataphin自动生成步骤名称,您也可以根据业务场景修改。命名规则如下:
只能包含汉字、字母、下划线(_)、数字。
不能超过64个字符。
数据源
选择已创建的Kudu数据源。
您可以单击数据源后的新建,进入规划模块新建数据源。后续操作,详情请参见创建Kudu数据源。
说明进行属性配置的账号,需具备该数据源的同步写权限。如果没有权限,则需要申请数据源权限,详情请参见申请数据源权限。
表
选择Kudu数据源中的数据表。
说明若数据源中指定了表前缀,则仅能选择以表前缀开头的表。
加载策略
追加数据:向目标表插入数据,主键不存在则插入,主键存在则忽略,即数据不会更新。
覆盖数据:向目标表插入数据,主键不存在则插入,主键存在则更新数据。
字段映射
映射关系用于将上游的输入字段和目标表的输出字段映射起来,可以手动选择字段映射或批量根据同行或同名映射。
输入字段:展示上游的输入字段。
输出字段:展示输出字段,Kudu的全部输出字段需和输入组件的字段映射。
快速映射:根据上游的输入和目标表的字段,可以手动选择字段映射。
同名映射:对字段名称相同的字段进行映射。
同行映射:上游的输入字段和目标表的字段名称不一致时,可选择字段对应行的数据进行映射。
单击确认。