如何使用Min-Max归一化组件_隐私增强计算(DataTrust)-阿里云帮助中心

一、组件说明

在联邦学习任务中，Min-Max归一化，也称为离差标准化，是一种常见的数据预处理方法，在机器学习中广泛应用。它的目的是将数值类型数据缩放到一个指定的范围内，通常是 [0,1] 或 [-1,1]。

通过 Min-Max 归一化，使得不同特征之间的数值具有可比性，同时降低模型对于特征尺度的敏感度，从而提高机器学习算法的准确性和稳定性。但是，需要注意的是，如果原始数据的分布不均匀，或者存在离群值，Min-Max 归一化可能会导致数据的失真，因此用户在应用时需要根据具体情况进行选择。

组件截图

二、参数说明

参数名称	参数说明
选择归一化字段	选择需要归一化的字段。可多选。

三、有配置文件可读

在上游有配置文件可以选择的时候，可以使用配置文件进行Min-Max归一化。填充的字段、方式、映射方式、缩放比例和配置文件相同。举例：在训练过程中，训练数据的值域为[1, 10000]，映射为[0, 1]。希望用训练数据的缩放比例来填充至预测数据中，此时可以将训练时使用的配置文件，通过【读配置文件】接入到【Min-Max归一化】的输入桩中，以此来保证训练数据和预测数据的一致性，如下图所示：