阿里云首页 工业大脑开放平台

批量数据合并

本文为您介绍数据处理组件中的批量数据合并组件。

功能说明

批量数据合并组件是将两个输入的数据按照各个输入指定的索引进行数据合并。

计算逻辑原理

  • 内连接:使用两个数据中索引列的交集,类似于SQL内部连接

  • 外连接:使用两个框架中索引列的并集(外连接合并时可能会产生空值(置为NaN)),类似于SQL外部连接

参数说明

IN1端口

参数名

参数描述

是否必填

输入数据类型

数据源类型

IN1-索引列

配置IN1端口输入数据的索引列。

IN1索引和IN2索引的个数要相同。

不限

说明

IN1-索引列和IN2-索引列对应的参数的输入数据类型需一致

  • csv组件

  • igateoffline组件

  • 平台上其他数据处理组件

  • 按照平台组件开发的自定义组件

IN1-数据列

配置IN1端口输入数据的数据列(IN1和IN2数据列的输入参数名不能重复)。

不限

  • csv组件

  • igateoffline组件

  • 平台上其他数据处理组件

  • 按照平台组件开发的自定义组件

IN2端口

参数名

参数描述

是否必填

输入数据类型

数据源类型

IN2-索引列

配置IN2端口输入数据的索引列。

IN1索引和IN2索引的个数要相同。

不限

(说明:IN2-索引列和IN1-索引列对应的参数的输入数据类型需一致)

  • csv组件

  • igateoffline组件

  • 平台上其他数据处理组件

  • 按照平台组件开发的自定义组件

IN2-数据列

配置IN2端口输入数据的数据列(IN1和IN2数据列的输入参数名不能重复)。

不限

  • csv组件

  • igateoffline组件

  • 平台上其他数据处理组件

  • 按照平台组件开发的自定义组件

OUT端口

参数名

参数描述

是否必填

输出数据类型

输出

输出参数包含IN1、IN2端口所有索引列和数据列去重后的输入参数。

IN1索引列:与输入数据类型一致

IN1数据列:与输入数据类型一致

IN2索引列:与输入数据类型一致

IN2数据列:与输入数据类型一致

其他参数

参数名

参数描述

是否必填

参数默认值

参数范围

合并方式

选择数据合并的方式。

内连接

  • 内连接

  • 外连接