阿里云首页 工业大脑开放平台

数据归一化

本文为您介绍数据处理组件中的数据归一化组件。

功能说明

数据归一化对指定的数据列进行归一化处理。在很多项目中,数据来源不同,量纲及量纲单位不同,为了让它们具备可比性,需要采用标准化方法消除由此带来的偏差。归一化的方法包括:min-max和z-score两种方法。

计算逻辑原理

  • min-max:(x- min) / (max- min),若x取值相同,则归一化输出0.5。

  • z-score:(x-mean) / std,若x取值相同,则归一化输出0。

参数说明

IN端口

参数名

参数描述

是否必填

输入数据类型

数据源类型

数据列

配置需要归一化处理的数据列。

整数或浮点数

说明

若存在非数值数据,则会置为NaN

  • csv组件

  • igateoffline组件

  • 平台上其他数据处理组件

  • 按照平台组件开发的自定义组件

OUT端口

参数名

参数描述

是否必填

输出数据类型

输出

归一化后的输出,需要保持和输入数据列名称一致。

浮点数

其他参数

参数名

参数描述

是否必填

参数默认值

参数范围

归一化方法

归一化处理方法。

  • min-max:若变量列最大值max大于变量列最小值min,则输出(x- min) / (max- min);若max=min,则输出0.5。

  • z-score:若变量列标准差std不等于0,则输出(x-mean) / std;若std等于0,则输出0。

min-max

  • min-max

  • z-score