回归模型评估是指基于预测结果和原始结果,评估回归算法模型的优劣性,从而输出评估指标及残差直方图。

回归模型评估

PAI-Studio支持通过可视化或PAI命令的方式,配置该组件参数:
  • 可视化方式
    页签 参数 描述
    字段设置 原回归值 支持数值类型。
    预测回归值 支持数值类型。
    执行调优 节点个数 与参数单个节点内存大小搭配使用,取值范围为1~9999。
    单个节点内存大小 取值范围为1024 MB~64*1024 MB。
  • PAI命令方式
    PAI -name regression_evaluation -project algo_public
        -DinputTableName=input_table
        -DyColName=y_col
        -DpredictionColName=prediction_col
        -DindexOutputTableName=index_output_table
        -DresidualOutputTableName=residual_output_table;
    参数 是否必选 参数描述 默认值
    inputTableName 输入表的名称。
    inputTablePartitions 输入表中,参与计算的分区。 全表
    yColName 输入表中,原始因变量的列名,支持数值类型。
    predictionColName 预测结果中,因变量的列名,支持数值类型。
    indexOutputTableName 回归指标输出表的名称。
    residualOutputTableName 残差直方图输出表的名称。
    intervalNum 直方图区间数量。 100
    lifecycle 输出表的生命周期,取值范围为正整数。
    coreNum Instance数量,取值范围为1~9999。 系统自动设置
    memSizePerCore 每个核心的内存,取值范围为1024 MB~64*1024 MB。 系统自动设置

组件输出

回归指标输出表的输出结果为JSON格式,包括以下参数。
参数 描述
SST 总平方和
SSE 误差平方和
SSR 回归平方和
R2 判定系数
R 多重相关系数
MSE 均方误差
RMSE 均方根误差
MAE 平均绝对误差
MAD 平均误差
MAPE 平均绝对百分误差
count 行数
yMean 原始因变量的均值
predictionMean 预测结果的均值