特征稳定性PSI

更新时间:

一、组件说明

特征稳定性PSI(Population Stability Index)是一种用于比较两个不同时间段或数据集之间特征分布差异的指标。PSI通常用于评估模型在不同时间段或不同数据集上特征分布的稳定性,以确保模型的预测结果在不同环境下的一致性。

PSI的值表示特征分布的变化程度,数值越大表示特征分布的变化越大,稳定性越差。

PSI可以帮助用户评估模型的稳定性和鲁棒性,进而决策是否需要重新训练模型或者更新模型。PSI也可以用于进行特征选择,选取在不同时间段或不同数据集中分布稳定的特征,避免使用不稳定的特征对模型性能造成负面影响。

在联邦学习任务中,PSI是通过联邦建模来实现的,可以保证数据的安全前提下,计算对应两方数据的PSI值。

在PSI计算完成后,用户可以右键组件,选择查看节点数据报告,来查看数据的PSI值。

组件截图

image.png

二、参数说明

参数名称

参数说明

选择特征字段

选择想要进行PSI计算的字段名,多选。