评分卡预测是一种机器学习技术,通过应用评分卡模型对新数据进行评分,以预测其未来表现或风险。该模型通常由评分卡训练组件生成,评分卡预测组件则利用该模型对输入数据进行评估和打分,从而帮助决策制定和风险管理。
配置组件
方式一:可视化方式
在Designer工作流页面添加评分卡预测组件,并在界面右侧配置相关参数:
参数类型 | 参数 | 描述 |
参数类型 | 参数 | 描述 |
字段设置 | 特征列 | 选择用于预测的原始特征列,默认选择全部。 |
原样添加到结果表 | 选择不进行任何处理,直接附加到预测结果表中的列。例如ID列和目标列等。 | |
输出变量分 | 是否输出每个特征变量所对应的分数,最终的预测总得分为截距项的得分加所有的变量分。 | |
执行调优 | 核数目 | 使用的CPU Core数量,默认系统自动分配。 |
每个核的内存大小 | 每个CPU Core所用的内存大小,默认系统自动分配。 |
方式二:PAI命令方式
使用PAI命令配置评分卡预测组件参数。您可以使用SQL脚本组件进行PAI命令调用,详情请参见SQL脚本。
pai -name=lm_predict
-project=algo_public
-DinputFeatureTableName=input_data_table
-DinputModelTableName=input_model_table
-DmetaColNames=sample_key,label
-DfeatureColNames=fea1,fea2
-DoutputTableName=output_score_table
参数 | 是否必选 | 默认值 | 描述 |
参数 | 是否必选 | 默认值 | 描述 |
inputFeatureTableName | 是 | 无 | 输入特征数据表。 |
inputFeatureTablePartitions | 否 | 全表 | 输入特征表选择的分区。 |
inputModelTableName | 是 | 无 | 输入的模型表。 |
featureColNames | 否 | 所有列 | 输入表选择的特征列。 |
metaColNames | 否 | 无 | 不进行转换的数据列,选中的列会原样输出。可以在此指定Label和sample_id等。 |
outputFeatureScore | 否 | false | 预测结果中是否输出变量分,取值包括:
|
outputTableName | 是 | 无 | 输出预测结果表。 |
lifecycle | 否 | 无 | 输出表的生命周期。 |
coreNum | 否 | 默认自动计算 | 核心数。 |
memSizePerCore | 否 | 默认自动计算 | 内存大小,单位为MB。 |
组件输出
评分卡预测组件输出的打分表示例如下:其中churn列为用户选择的原样添加到结果表中的列,与预测结果无关。其它三列为预测结果列,其含义如下表所示。
列名 | 列类型 | 列描述 |
列名 | 列类型 | 列描述 |
prediction_score | DOUBLE | 预测分数列。线性模型中特征值和模型权重值直接相乘相加的结果,对应到评分卡模型中,如果模型进行了分数转换,则该分数输出转换后的得分。 |
prediction_prob | DOUBLE | 二分类场景中预测得到的正例概率值,原始得分(未经分数转换)经过Sigmoid变换后得到该值。 |
prediction_detail | STRING | 用JSON格式描述的各类别概率值,其中0表示负类,1表示正类。例如{“0”:0.1813110520,”1”:0.8186889480}。 |
- 本页导读 (1)
- 配置组件
- 方式一:可视化方式
- 方式二:PAI命令方式
- 组件输出