文档

GBDT二分类预测V2

更新时间:

GBDT二分类预测V2组件提供了针对GBDT二分类V2组件的预测功能,使用梯度提升决策树 (Gradient Boosting Decision Trees) 算法,对数据进行二分类问题的预测。本文介绍GBDT二分类预测V2组件的配置方法。

支持计算资源

支持的计算引擎为MaxCompute和Flink。

算法原理

梯度提升决策树模型构建了一个由多棵决策树组成的组合模型。每一棵决策树对应一个弱学习器,将这些弱学习器组合在一起,可以达到比较好的分类或回归效果。

梯度提升的基本递推结构为:

image

其中,image通常为一棵 CART 决策树,image为决策树的参数,image为步长。第m棵决策树在前m-1棵决策树的基础上对目标函数进行优化。最终得到包含若干棵决策树的模型。

可视化配置参数

  • 输入桩配置

    输入桩(从左到右)

    限制数据类型

    建议上游组件

    是否必选

    模型表

    GBDT二分类V2

    预测数据表

    读数据表

  • 右侧参数表单

    页签

    参数

    是否必选

    描述

    默认值

    字段设置

    预测结果列名

    预测结果列名。

    prediction_result

    预测详细信息列名

    预测详细信息列名。

    prediction_detail

    算法保留列

    保留列名,默认保留所有列。

    执行调优

    节点数

    执行作业的节点数。

    根据输入数据自动计算

    每节点内存

    节点所使用的内存数,单位为MB,取值范围为[100,65536]。

    根据输入数据自动计算

  • 输出桩说明

    输出桩

    存储位置

    下游建议组件

    模型类型

    输出

    不需要配置

    二分类评估

相关文档

  • 该组件使用GBDT二分类V2组件训练得到的模型,对数据进行二分类预测。

  • 关于Designer组件更详细的内容介绍,请参见Designer概述

  • Designer预置了多种算法组件,你可以根据不同的使用场景选择合适的组件进行数据处理,详情请参见组件参考:所有组件汇总