文档

回归模型评估

更新时间:

回归模型评估是指基于预测结果和原始结果,评估回归算法模型的优劣性,从而输出评估指标及残差直方图。

组件配置

您可以使用以下任意一种方式,配置回归模型评估组件参数。

方式一:可视化方式

Designer工作流页面配置组件参数。

页签

参数

描述

字段设置

原回归值

支持数值类型。

预测回归值

支持数值类型。

执行调优

节点个数

与参数单个节点内存大小搭配使用,取值范围为1~9999。

单个节点内存大小

取值范围为1024 MB~64*1024 MB。

方式二:PAI命令方式

使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI命令调用,详情请参见SQL脚本

PAI -name regression_evaluation -project algo_public
    -DinputTableName=input_table
    -DyColName=y_col
    -DpredictionColName=prediction_col
    -DindexOutputTableName=index_output_table
    -DresidualOutputTableName=residual_output_table;

参数

是否必选

参数描述

默认值

inputTableName

输入表的名称。

inputTablePartitions

输入表中,参与计算的分区。

全表

yColName

输入表中,原始因变量的列名,支持数值类型。

predictionColName

预测结果中,因变量的列名,支持数值类型。

indexOutputTableName

回归指标输出表的名称。

residualOutputTableName

残差直方图输出表的名称。

intervalNum

直方图区间数量。

100

lifecycle

输出表的生命周期,取值范围为正整数。

coreNum

Instance数量,取值范围为1~9999。

系统自动设置

memSizePerCore

每个核心的内存,取值范围为1024 MB~64*1024 MB。

系统自动设置

组件输出

回归指标输出表的输出结果为JSON格式,包括以下参数。

参数

描述

SST

总平方和

SSE

误差平方和

SSR

回归平方和

R2

判定系数

R

多重相关系数

MSE

均方误差

RMSE

均方根误差

MAE

平均绝对误差

MAD

平均误差

MAPE

平均绝对百分误差

count

行数

yMean

原始因变量的均值

predictionMean

预测结果的均值