回归模型评估是指基于预测结果和原始结果,评估回归算法模型的优劣性,从而输出评估指标及残差直方图。

组件配置

您可以使用以下任意一种方式,配置回归模型评估组件参数。

方式一:可视化方式

在PAI-Designer(原PAI-Studio)工作流页面配置组件参数。
页签 参数 描述
字段设置 原回归值 支持数值类型。
预测回归值 支持数值类型。
执行调优 节点个数 与参数单个节点内存大小搭配使用,取值范围为1~9999。
单个节点内存大小 取值范围为1024 MB~64*1024 MB。

方式二:PAI命令方式

使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI命令调用,详情请参见SQL脚本
PAI -name regression_evaluation -project algo_public
    -DinputTableName=input_table
    -DyColName=y_col
    -DpredictionColName=prediction_col
    -DindexOutputTableName=index_output_table
    -DresidualOutputTableName=residual_output_table;
参数 是否必选 参数描述 默认值
inputTableName 输入表的名称。
inputTablePartitions 输入表中,参与计算的分区。 全表
yColName 输入表中,原始因变量的列名,支持数值类型。
predictionColName 预测结果中,因变量的列名,支持数值类型。
indexOutputTableName 回归指标输出表的名称。
residualOutputTableName 残差直方图输出表的名称。
intervalNum 直方图区间数量。 100
lifecycle 输出表的生命周期,取值范围为正整数。
coreNum Instance数量,取值范围为1~9999。 系统自动设置
memSizePerCore 每个核心的内存,取值范围为1024 MB~64*1024 MB。 系统自动设置

组件输出

回归指标输出表的输出结果为JSON格式,包括以下参数。
参数 描述
SST 总平方和
SSE 误差平方和
SSR 回归平方和
R2 判定系数
R 多重相关系数
MSE 均方误差
RMSE 均方根误差
MAE 平均绝对误差
MAD 平均误差
MAPE 平均绝对百分误差
count 行数
yMean 原始因变量的均值
predictionMean 预测结果的均值