文档

配置Kudu输出组件

更新时间:

配置Kudu输出组件后,可以将其他数据源的数据写入Kudu数据源。本文为您介绍如何配置Kudu输出组件。

前提条件

在开始执行操作前,请确认您已完成以下操作:

操作步骤

  1. 参见离线管道组件开发入口,进入离线单条管道脚本的开发页面。

  2. 在离线单条管道脚本的开发页面,按照下图操作指引,进入Kudu输出配置对话框。

    属性配置

  3. Kudu输出配置对话框,配置参数。

    参数

    描述

    步骤名称

    Dataphin自动生成步骤名称,您也可以根据业务场景修改。命名规则如下:

    • 只能包含汉字、字母、下划线(_)、数字。

    • 不能超过64个字符。

    数据源

    选择已创建的Kudu数据源。

    您可以单击数据源后的新建,进入规划模块新建数据源。后续操作,详情请参见创建Kudu数据源

    说明

    进行属性配置的账号,需具备该数据源的同步写权限。如果没有权限,则需要申请数据源权限,详情请参见申请数据源权限

    选择Kudu数据源中的数据表。

    说明

    若数据源中指定了表前缀,则仅能选择以表前缀开头的表。

    加载策略

    • 追加数据:向目标表插入数据,主键不存在则插入,主键存在则忽略,即数据不会更新。

    • 覆盖数据:向目标表插入数据,主键不存在则插入,主键存在则更新数据。

    字段映射

    映射关系用于将上游的输入字段和目标表的输出字段映射起来,可以手动选择字段映射或批量根据同行或同名映射。

    • 输入字段:展示上游的输入字段。

    • 输出字段:展示输出字段,Kudu的全部输出字段需和输入组件的字段映射。

    • 快速映射:根据上游的输入和目标表的字段,可以手动选择字段映射。

      • 同名映射:对字段名称相同的字段进行映射。

      • 同行映射:上游的输入字段和目标表的字段名称不一致时,可选择字段对应行的数据进行映射。

  4. 单击确认