逻辑回归

本文为您介绍逻辑回归组件。

功能说明

逻辑回归(LogisticRegression)是一种用于解决二分类(0 or 1)问题的模型,用于估计某种事物的可能性。尽管名字是逻辑回归,但它是一种用于分类而不是回归的线性模型。Logistic 回归在文献中也称为 logit 回归、最大熵分类 (MaxEnt) 或对数线性分类器。在该模型中,描述单个试验可能结果的概率使用逻辑函数建模 。

计算逻辑原理

逻辑回归的思路是,先拟合决策边界(不局限于线性,还可以是多项式),再建立这个边界与分类的概率联系,从而得到了二分类情况下的概率。本质是假设数据服从这个分布,然后使用极大似然估计做参数的估计。

参数说明

IN端口

参数名

参数描述

是否必填

输入数据类型

数据源类型

特征变量

配置模型特征列

整数或浮点数

说明

若存在非数值数据,则会抛出异常。

  • CSV组件。

  • IGateInOffline组件。

  • 平台上其他数据处理组件。

  • 按照平台规范开发的自定义组件。

目标变量

配置模型目标列

整数或浮点数或字符

  • CSV组件。

  • IGateInOffline组件。

  • 平台上其他数据处理组件。

  • 按照平台规范开发的自定义组件。

模型端口

参数名

参数描述

输出参数

输出数据类型

模型

输出算法训练后模型存储的地址。

模型地址

字符

算法参数

参数名

参数描述

是否必填

参数默认值

参数范围

惩罚类型

用于指定惩罚中使用的规范

L2

  • L2

  • 无惩罚

正则强度的倒数

必须为正浮点数,与支持向量机一样,较小的值指定更强的正则化

1.0

[0, 99999999]

是否使用截距

指定是否应将常量(aka偏置或截距)添加到决策函数

分类权重

用于表示分类模型中各种类型的权重

None

可以是一个字典或者’balanced’字符串,默认为不输入,也就是不考虑权重,即为None

求解器

用于优化问题的算法

lbfgs

  • newton-cg(牛顿法)

  • lbfgs(L-BFGS拟牛顿法)

  • sag(随机梯度下降法)

最大迭代次数

求解程序收敛所需的最大迭代次数

100

[1, 10000]

分类方式

  • 二分类目标:采用one-vs-rest策略进行分类

  • 多分类目标:直接采用多分类逻辑回归模型

自动

  • 自动

  • 二分类目标

  • 多分类目标

测试集比例

测试模型的数据占总输入数据的比例,用于计算模型的评价指标。

0.2

[0,1]

测试集生成方式

根据选定方式,选取部分数据作为测试集,剩余部分作为训练集。

  • 随机:按比例随机从输入数据中截取n条数据作为测试集。

  • 头部:按比例将输入数据前n条数据作为测试集。

  • 尾部:按比例将输入数据后n条数据作为测试集。

随机

  • 随机

  • 头部

  • 尾部

其他参数

参数名

参数描述

模型结果

可以查看建模成功后的模型评价结果和发布模型。