窗口聚合

本文为您介绍窗口聚合组件。

功能说明

窗口聚合组件可以根据指定的索引,将相同索引的数据根据时间变量进行开窗聚合。在需要将某一段时间内的数据聚合时,可以使用窗口聚合组件。聚合的方法包括:均值、最大值、最小值、中位数、标准差、方差、求和。若窗口内无数值,聚合后会产生空值。

计算逻辑原理

  • 均值:取分组窗口中的均值。

  • 最大值:取分组窗口中的最大值。

  • 最小值:取分组窗口中的最小值。

  • 中位数:取分组窗口中的中位数(若数据总数为偶数,中位数取中间两个值的平均值)。

  • 标准差:取分组窗口中的标准差。

  • 方差:取分组窗口中的方差。

  • 求和:取分组窗口中的和。

参数说明

IN端口-输入参数

参数名

参数描述

是否必填

输入数据类型

数据源类型

聚合索引

按照索引进行分组聚合。

不限

  • CSV组件。

  • IGateInOffline组件。

  • 平台上其他数据处理组件。

  • 按照平台规范开发的自定义组件。

聚合变量

需要窗口聚合处理的变量。

整数或浮点数

说明

若存在非数值数据,则会置为NaN。

  • CSV组件。

  • IGateInOffline组件。

  • 平台上其他数据处理组件。

  • 按照平台规范开发的自定义组件。

时间变量

窗口处理的时间变量。

说明

算法支持的输入时间格式为:

  • yyyy-mm-dd hh:mm:ss 或 mm-dd-yyyy hh:mm:ss

  • yyyy/mm/dd hh:mm:ss 或 mm/dd/yyyy hh:mm:ss

  • hh:mm:ss yyyy-mm-dd 或 hh:mm:ss mm-dd-yyyy

  • hh:mm:ss yyyy/mm/dd 或 hh:mm:ss mm/dd/yyyy

年月日和时分秒之间也可用大写T连接,例如:2023-01-11T12:01:00。

建议输入时间格式:yyyy-mm-dd hh:mm:ss。

输出时间格式为:yyyy-mm-dd hh:mm:ss。

时间或字符

说明

若存在非时间数据,则会抛出异常。

  • CSV组件。

  • IGateInOffline组件。

  • 平台上其他数据处理组件。

  • 按照平台规范开发的自定义组件。

OUT端口-输出参数

参数名

参数描述

输出数据类型

输出

输出包含聚合索引、聚合变量和时间变量。

聚合索引:与输入数据类型一致。

聚合变量:浮点数。

时间变量:与输入数据类型一致。

其他参数

参数名

参数描述

是否必填

参数默认值

参数范围

聚合方法

选择窗口聚合的方法。

均值

  • 均值

  • 最大值

  • 最小值

  • 中位数

  • 标准差

  • 方差

  • 求和

窗口时长

聚合的窗口时长,单位:秒。

60

[0, 99999999]