数据聚合
本文为您介绍数据处理组件的数据聚合算法组件。
功能说明
数据聚合组件可以根据指定的索引列,将相同索引的数据进行聚合处理。需要将数据按照某个索引值聚合时,可以使用数据聚合组件。聚合的方法包括:均值、最大值、最小值、中位数、标准差、方差、求和。
计算逻辑原理
均值:取分组聚合中的均值。
最大值:取分组聚合中的最大值。
最小值:取分组聚合中的最小值。
中位数:取分组聚合中的中位数(若数据总数为偶数,中位数取中间两个值的平均值)。
标准差:取分组窗口聚合中的标准差。
方差:取分组窗口聚合中的方差。
求和:取分组窗口聚合中的和。
参数说明
IN端口
参数名 | 参数描述 | 是否必填 | 输入数据类型 | 数据源类型 |
索引列 | 按照索引列进行分组聚合。 | 是 | 不限 |
|
数据列 | 需要聚合处理的数据列。 | 是 | 整数或浮点数 说明 若存在非数值数据,则会置为NaN |
|
OUT端口
参数名 | 参数描述 | 是否必填 | 输出数据类型 |
输出 | 聚合后输出的参数为所有索引列和数据列的输入参数。 | 是 | 索引列:与输入数据类型一致 数据列:浮点数 |
其他参数
参数名 | 参数描述 | 是否必填 | 参数默认值 | 参数范围 |
聚合方法 | 选择数据聚合的方法。 | 是 | 均值 |
|