特征稳定性PSI
更新时间:
一、组件说明
特征稳定性PSI(Population Stability Index)是一种用于比较两个不同时间段或数据集之间特征分布差异的指标。PSI通常用于评估模型在不同时间段或不同数据集上特征分布的稳定性,以确保模型的预测结果在不同环境下的一致性。
PSI的值表示特征分布的变化程度,数值越大表示特征分布的变化越大,稳定性越差。
PSI可以帮助用户评估模型的稳定性和鲁棒性,进而决策是否需要重新训练模型或者更新模型。PSI也可以用于进行特征选择,选取在不同时间段或不同数据集中分布稳定的特征,避免使用不稳定的特征对模型性能造成负面影响。
在联邦学习任务中,PSI是通过联邦建模来实现的,可以保证数据的安全前提下,计算对应两方数据的PSI值。
在PSI计算完成后,用户可以右键组件,选择查看节点数据报告,来查看数据的PSI值。
组件截图
二、参数说明
参数名称 | 参数说明 |
选择特征字段 | 选择想要进行PSI计算的字段名,多选。 |
文档内容是否对您有帮助?