如何配置StarRocks输入组件用于读取数据源的数据_智能数据建设与治理 Dataphin(Dataphin)-阿里云帮助中心

备案控制台

输入文档关键字查找

StarRocks输入组件用于读取StarRocks数据源的数据。同步StarRocks数据源的数据至其他数据源的场景中，您需要先配置StarRocks输入组件读取的数据源，再配置数据同步的目标数据源。本文为您介绍如何配置StarRocks输入组件。

前提条件

已创建StarRocks数据源，如何创建，请参见创建StarRocks数据源。
进行StarRocks输入组件属性配置的账号，需具备该数据源的同步读权限。如果没有权限，则需要申请数据源权限，详情请参见申请、续期和交还数据源权限。

操作步骤

在Dataphin首页顶部菜单栏，选择研发 > 数据集成。
在集成页面顶部菜单栏选择项目（Dev-Prod模式需要选择环境）。
在左侧导航栏中单击离线集成，在离线集成列表中单击需要开发的离线管道，打开该离线管道的配置页面。
单击页面右上角的组件库，打开组件库面板。
在组件库面板左侧导航栏中需选择输入，在右侧的输入组件列表中找到StarRocks组件，并拖动该组件至画布。
单击StarRocks输入组件卡片中的图标，打开StarRocks输入配置对话框。

在StarRocks输入配置对话框中，配置以下参数。

参数	描述
步骤名称	即StarRocks输入组件的名称。Dataphin自动生成步骤名称，您也可以根据业务场景修改。命名规则如下：只能包含中文、字母、下划线（_）、数字。不能超过64个字符。
数据源	在数据源下拉列表中，展示当前Dataphin中所有StarRocks类型的数据源，包括您已拥有同步读权限的数据源和没有同步读权限的数据源。对于没有同步读权限的数据源，您可以单击数据源后的申请，申请数据源的同步读权限。具体操作，请参见申请数据源权限。如果您还没有StarRocks类型的数据源，单击新建，创建数据源。详情请参见创建StarRocks数据源。
来源表量	选择来源表量。来源表量包括单表和多表：单表：适用于将一个表的业务数据同步至一个目标表的场景。多表：适用于将多个表的业务数据同步至同一个目标表的场景。多个表的数据写入同一个数据表时，使用union算法。更多union说明，请参见交集、并集和补集。
表	选择来源表：如果来源表量选择了单表，则可选择输入的表，或直接输入表名称。如果来源表量选择了多表，则执行以下操作添加表。在输入框中，输入表的表达式，筛选具有相同结构的表。系统支持枚举形式、类正则形式及两者混合形式，例如：`table_[001-100];table_102。` 单击图标。在确认匹配详情对话框中，选择匹配的表。单击确认。
切分键	您可以将源数据表中字段类型为整型的某一列作为切分键，推荐使用主键或有索引的列作为切分键。读取数据时，根据配置的切分键字段进行数据分片，实现并发读取，可以提升数据同步效率。
批量读取条数	一次性读取数据的条数。在从源数据库读取数据时，可以配置一个特定的批量读取条数（如1024条记录），而不是一条一条地读取，以减少与数据源之间的交互次数，提高I/O效率，并降低网络延迟。
输入过滤	填写输入字段的过滤信息，例如`ds=${bizdate}`。输入过滤适用于以下两种场景：固定的某一部分数据。参数过滤。
输出字段	输出字段区域展示了已选中表及筛选条件命中的所有字段。支持新建或批量添加输出字段，如果不需要将某些字段输出至下游组件，也可以删除对应的字段。批量添加：单击批量添加，支持JSON、TEXT格式、DDL格式批量配置。以JSON格式批量配置，例如： `// 示例： [{ "name": "user_id", "type": "String" }, { "name": "user_name", "type": "String" }]` 说明 name表示引入的字段名称，type表示引入后的字段类型。例如，`"name":"user_id","type":"String"`表示把字段名为user_id的字段引入，设置字段类型为String。以TEXT格式批量配置，例如： `// 示例： user_id,String user_name,String` 行分隔符用于分隔每个字段的信息，默认为换行符（\n），可支持换行符（\n）、分号（;）、半角句号（.）。列分隔符用于分隔字段名与字段类型，默认为半角逗号（,）。以DDL格式批量配置，例如： `CREATE TABLE tablename ( id INT PRIMARY KEY, name VARCHAR(50), age INT );` 新建输出字段：单击+新建输出字段，根据页面提示填写字段和选择类型。单个删除字段：如果需要删除少量的字段，可单击输出字段列表目标字段操作列下的图标，删除多余的字段。说明当计算引擎为StarRocks时，StarRocks输入组件的输出字段支持查看字段的分类分级，非StarRocks计算引擎则不支持。批量删除字段：如果需要删除大批量字段，可单击字段管理，在字段管理对话框选择多个字段后，单击左移图标，将已选的输入字段移入到未选的输入字段并单击确认，完成字段的批量删除。

单击确认，完成StarRocks输入组件的属性配置。

上一篇：配置SAP Table输入组件下一篇：配置Elasticsearch输入组件

文档内容是否对您有帮助？