Min-Max归一化

更新时间:

一、组件说明

在联邦学习任务中,Min-Max归一化,也称为离差标准化,是一种常见的数据预处理方法,在机器学习中广泛应用。它的目的是将数值类型数据缩放到一个指定的范围内,通常是 [0,1] 或 [-1,1]。

通过 Min-Max 归一化,使得不同特征之间的数值具有可比性,同时降低模型对于特征尺度的敏感度,从而提高机器学习算法的准确性和稳定性。但是,需要注意的是,如果原始数据的分布不均匀,或者存在离群值,Min-Max 归一化可能会导致数据的失真,因此用户在应用时需要根据具体情况进行选择。

组件截图

image.png

二、参数说明

参数名称

参数说明

选择归一化字段

选择需要归一化的字段。可多选。

三、有配置文件可读

在上游有配置文件可以选择的时候,可以使用配置文件进行Min-Max归一化。填充的字段、方式、映射方式、缩放比例和配置文件相同。举例:在训练过程中,训练数据的值域为[1, 10000],映射为[0, 1]。希望用训练数据的缩放比例来填充至预测数据中,此时可以将训练时使用的配置文件,通过【读配置文件】接入到【Min-Max归一化】的输入桩中,以此来保证训练数据和预测数据的一致性,如下图所示:

image.png