Min-Max归一化
更新时间:
一、组件说明
在联邦学习任务中,Min-Max归一化,也称为离差标准化,是一种常见的数据预处理方法,在机器学习中广泛应用。它的目的是将数值类型数据缩放到一个指定的范围内,通常是 [0,1] 或 [-1,1]。
通过 Min-Max 归一化,使得不同特征之间的数值具有可比性,同时降低模型对于特征尺度的敏感度,从而提高机器学习算法的准确性和稳定性。但是,需要注意的是,如果原始数据的分布不均匀,或者存在离群值,Min-Max 归一化可能会导致数据的失真,因此用户在应用时需要根据具体情况进行选择。
组件截图
二、参数说明
参数名称 | 参数说明 |
选择归一化字段 | 选择需要归一化的字段。可多选。 |
三、有配置文件可读
在上游有配置文件可以选择的时候,可以使用配置文件进行Min-Max归一化。填充的字段、方式、映射方式、缩放比例和配置文件相同。举例:在训练过程中,训练数据的值域为[1, 10000],映射为[0, 1]。希望用训练数据的缩放比例来填充至预测数据中,此时可以将训练时使用的配置文件,通过【读配置文件】接入到【Min-Max归一化】的输入桩中,以此来保证训练数据和预测数据的一致性,如下图所示:
文档内容是否对您有帮助?