本文为您介绍逻辑回归组件。
功能说明
逻辑回归(LogisticRegression)是一种用于解决二分类(0 or 1)问题的模型,用于估计某种事物的可能性。尽管名字是逻辑回归,但它是一种用于分类而不是回归的线性模型。Logistic 回归在文献中也称为 logit 回归、最大熵分类 (MaxEnt) 或对数线性分类器。在该模型中,描述单个试验可能结果的概率使用逻辑函数建模 。
计算逻辑原理
逻辑回归的思路是,先拟合决策边界(不局限于线性,还可以是多项式),再建立这个边界与分类的概率联系,从而得到了二分类情况下的概率。本质是假设数据服从这个分布,然后使用极大似然估计做参数的估计。
参数说明
IN端口
参数名 | 参数描述 | 是否必填 | 输入数据类型 | 数据源类型 |
特征变量 | 配置模型特征列 | 是 | 整数或浮点数 说明 若存在非数值数据,则会抛出异常。 |
|
目标变量 | 配置模型目标列 | 是 | 整数或浮点数或字符 |
|
模型端口
参数名 | 参数描述 | 输出参数 | 输出数据类型 |
模型 | 输出算法训练后模型存储的地址。 | 模型地址 | 字符 |
算法参数
参数名 | 参数描述 | 是否必填 | 参数默认值 | 参数范围 |
惩罚类型 | 用于指定惩罚中使用的规范 | 否 | L2 |
|
正则强度的倒数 | 必须为正浮点数,与支持向量机一样,较小的值指定更强的正则化 | 否 | 1.0 | [0, 99999999] |
是否使用截距 | 指定是否应将常量(aka偏置或截距)添加到决策函数 | 否 | 是 |
|
分类权重 | 用于表示分类模型中各种类型的权重 | 否 | None | 可以是一个字典或者’balanced’字符串,默认为不输入,也就是不考虑权重,即为None |
求解器 | 用于优化问题的算法 | 否 | lbfgs |
|
最大迭代次数 | 求解程序收敛所需的最大迭代次数 | 否 | 100 | [1, 10000] |
分类方式 |
| 否 | 自动 |
|
测试集比例 | 测试模型的数据占总输入数据的比例,用于计算模型的评价指标。 | 是 | 0.2 | [0,1] |
测试集生成方式 | 根据选定方式,选取部分数据作为测试集,剩余部分作为训练集。
| 是 | 随机 |
|
其他参数
参数名 | 参数描述 |
模型结果 | 可以查看建模成功后的模型评价结果和发布模型。 |