文档

评分卡预测

更新时间:

评分卡预测组件对原始数据根据评分卡训练组件产出的模型结果进行预测打分。

组件配置

您可以使用以下任意一种方式,配置评分卡预测组件参数。

方式一:可视化方式

Designer工作流页面配置组件参数。

页签

参数

描述

字段设置

特征列

选择用于预测的原始特征列,默认选择全部。

原样添加到结果表

选择不进行任何处理,直接附加到预测结果表中的列。例如ID列和目标列等。

输出变量分

是否输出每个特征变量所对应的分数,最终的预测总得分为截距项的得分加所有的变量分。

执行调优

核数目

使用的CPU Core数量,默认系统自动分配。

每个核的内存大小

每个CPU Core所用的内存大小,默认系统自动分配。

方式二:PAI命令方式

使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI命令调用,详情请参见SQL脚本

pai -name=lm_predict
    -project=algo_public
    -DinputFeatureTableName=input_data_table
    -DinputModelTableName=input_model_table
    -DmetaColNames=sample_key,label
    -DfeatureColNames=fea1,fea2
    -DoutputTableName=output_score_table

参数

描述

是否必选

默认值

inputFeatureTableName

输入特征数据表。

inputFeatureTablePartitions

输入特征表选择的分区。

全表

inputModelTableName

输入的模型表。

featureColNames

输入表选择的特征列。

所有列

metaColNames

不进行转换的数据列,选中的列会原样输出。可以在此指定Label和sample_id等。

outputFeatureScore

预测结果中是否输出变量分,取值包括:

  • true:输出变量分。

  • false:不输出变量分。

false

outputTableName

输出预测结果表。

lifecycle

输出表的生命周期。

coreNum

核心数。

默认自动计算

memSizePerCore

内存大小,单位为MB。

默认自动计算

组件输出

评分卡预测组件输出的打分表示例如下。打分表示例其中churn列为用户选择的原样添加到结果表中的列,与预测结果无关。其它三列为预测结果列,其含义如下表所示。

列名

列类型

列描述

prediction_score

DOUBLE

预测分数列。线性模型中特征值和模型权重值直接相乘相加的结果,对应到评分卡模型中,如果模型进行了分数转换,则该分数输出转换后的得分。

prediction_prob

DOUBLE

二分类场景中预测得到的正例概率值,原始得分(未经分数转换)经过Sigmoid变换后得到该值。

prediction_detail

STRING

用JSON格式描述的各类别概率值,其中0表示负类,1表示正类。例如{“0”:0.1813110520,”1”:0.8186889480}