二分-二分文档介绍内容-阿里云

MLP二分类/MLP多分类/MLP回归

一、组件说明 MLP二分类是指使用多层感知机（Multi-Layer Perceptron）进行二元分类问题的解决。多层感知机是一种前馈神经网络，通过多个神经元的组合对输入特征进行非线性变换和特征提取，最终输出一个连续的预测结果。在训练过程中，利用...

横向MLP二分类/MLP多分类/MLP回归

一、组件说明横向MLP二分类是指使用多层感知机（Multi-Layer Perceptron）进行二元分类问题的解决。多层感知机是一种前馈神经网络，通过多个神经元的组合对输入特征进行非线性变换和特征提取，最终输出一个连续的预测结果。在训练过程中，...

二分类评估

一、组件说明二分类模型的评估任务，可以输出ACC值、AUC、KS值、ROC曲线等。组件截图二、参数说明参数名称参数说明标签字段样本的label标签，用于当做Ground Truth，用于评估。单选。正样本标签值正样本标签的原值或编码值，如：>50...

二分类评估

二分类评估通过计算AUC、KS及F1 Score指标，输出KS曲线、PR曲线、ROC曲线、LIFT Chart及Gain Chart。组件配置您可以使用以下任意一种方式，配置二分类评估组件参数。方式一：可视化方式在 Designer 工作流页面配置组件参数。参数描述 ...

横向二分类评估

一、组件说明横向二分类模型的评估任务，可以输出ACC值、AUC、KS值、ROC曲线等。支持使用单方或多方联合数据，评估横向二分类模型。组件截图二、参数说明参数名称参数说明标签字段样本的label标签，用于当做Ground Truth，用于评估。...

GBDT二分类V2

梯度提升决策树(Gradient Boosting Decision Trees)二分类，是经典的基于梯度提升（Gradient Boosting）的有监督学习模型，可以用来解决二分类问题。支持计算资源支持的计算引擎为MaxCompute。算法简介梯度提升决策树(Gradient Boosting ...

GBDT二分类预测V2

GBDT二分类预测V2组件提供了针对GBDT二分类V2组件的预测功能，使用梯度提升决策树(Gradient Boosting Decision Trees)算法，对数据进行二分类问题的预测。本文介绍GBDT二分类预测V2组件的配置方法。支持计算资源支持的计算引擎为...

GBDT二分类

GBDT（Gradient Boosting Decision Tree）二分类算法的原理是设置阈值，如果特征值大于阈值，则为正例，反之为负例。组件配置您可以使用以下任意一种方式，配置GBDT二分类组件参数。方式一：可视化方式在 Designer 工作流页面配置组件...

逻辑回归二分类

训练成功后的模型保存训练成功后，模型将依据联邦建模双方的特征，分片保存在各自的平台上。训练成功的模型保存在【项目台】-【模型管理】-【模型文件】中，保存名称为${工作流名称}_${建模组件名称}。例如，本项目中有成功建模的任务名为...

逻辑回归二分类

经典逻辑回归是一个二分类算法，支持稀疏及稠密数据格式。组件配置您可以使用以下任意一种方式，配置逻辑回归二分类组件参数。方式一：可视化方式在 Designer 工作流页面配置组件参数。页签参数描述字段设置训练特征列输入数据源中...

XGBOOST二分类

隐私开销 epsilon 联邦学习中，差分隐私的隐私开销，数值越大，添加的噪声越小，隐私保护越弱，则越精确，训练效果越好；数值越小，隐私保护强度越强，则单样本噪音值越大，获取统计特征越困难。默认epsilon=3.0。训练成功后的模型保存 ...

横向逻辑回归二分类

一、组件说明横向逻辑回归通过将线性回归...例如，本项目中有成功建模的任务名为“1_横向虚拟关联_train算法”，其中有建模组件名字为“横向逻辑回归二分类”，则模型名字为“1_横向虚拟关联_train算法_横向逻辑回归二分类”，如下图所示：

PS-SMART二分类训练

使用说明 PS-SMART二分类训练组件的目标列仅支持数值类型，且 0 表示负例，1 表示正例。如果MaxCompute表数据是STRING类型，则需要进行类型转换。例如，分类目标是 Good/Bad 字符串，需要转换为 1/0。如果数据是KV格式，则特征ID必须为正...

MaxCompute PS-SMART二分类最佳实践

本文为您介绍如何通过提交一个使用MaxCompute计算资源的超参数调优实验，来运行PS-SMART二分类、预测和评估组件，以获取PS-SMART组件算法的较优超参数组合。前提条件首次使用AutoML功能时，需要完成AutoML相关权限授权。具体操作，请参见 ...

二分类

算法建模

本文以逻辑回归二分类算法为例，为您介绍如何使用PAI Designer训练模型。前提条件完成数据可视化，详情请参见数据可视化。操作步骤登录 PAI控制台，进入工作流页面。操作详情请参见 step1：进入工作流页面。构建逻辑回归二分类节点并...

评估模型

本文以评估二分类训练模型为例，为您介绍如何进行模型评估。前提条件完成建模，详情请参见算法建模。操作步骤登录 PAI控制台，进入工作流页面。操作详情请参见 step1：进入工作流页面。构建预测节点。在组件列表中分别搜索预测组件，...

数据建模

在左侧组件列表，将机器学习>二分类下的逻辑回归二分类组件拖入画布中。通过连线，将逻辑回归二分类-1 节点作为拆分-1 节点输出表1 端口的下游节点。单击画布中的逻辑回归二分类-1 节点，在右侧字段设置页签，将特征列设置为 ...

横向预测

一、组件说明横向预测组件是专门用于横向模型预测的组件，如横向逻辑回归二分类、横向MLP二分类等。输入为预测数据表和模型，输出为预测结果。支持使用单方或多方联合数据，获得横向模型预测结果。横向二分类和多分类模型预测结果包括...

预测

一、组件说明预测组件是专门用于模型预测的组件，如XGBOOST二分类、多分类等。输入为预测数据表和模型，输出为预测结果。二分类和多分类模型预测结果包括predict_result预测结果列和predict_detail预测结果详细列。回归模型的预测组件输出...

雾霾天气预测

本文通过分析北京一年的真实天气数据，构建雾霾天气预测模型，...在二分类评估对话框，单击评估图表页签，即可查看逻辑回归二分类训练模型的预测效果。AUC的取值表示逻辑回归二分类组件训练的雾霾天气预测模型的准确率达到了98%以上。

节点/数据库/表/分区/二级分区

介绍节点、数据库、表、分区表和二级分区的概念。节点在HybridDB for MySQL中，节点是一个资源单位（比如当前C2规格对应：8 ...一级分区将表切分为shard（分片），二级分区则是在每个shard内再进行分区。目前HybridDB最多只支持两级分区。

异常指标监控

解决方案 PAI提供了一套基于指标监控的分类算法，将异常指标监控抽象为二分类场景，并将监控模型部署至在线系统，从而实现近线风控。该方案的要求如下：人力要求：需要熟悉机器学习经典算法，尤其是特征工程及二分类算法。开发周期：1~2天...

基于对象特征的推荐

通常，推荐场景都属于二分类实验，可以使用混淆矩阵和二分类评估组件评估模型预测结果。运行实验并查看输出结果。单击画布上方的运行。实验运行结束后，右键单击画布中的逻辑回归二分类-1，在快捷菜单，单击模型选项>导出PMML，即可导出...

读模型文件

例如，本项目中有成功建模的任务名为“xgb_criteo_10w”，其中有建模组件名字为“XGBOOST二分类”，则模型名字为“xgb_criteo_10w_XGBOOST二分类”。选择模型版本若之前的任务运行过多次，用户可以根据效果，自行选择不同版本的模型。则...

创建标签

每个标签由一对键值组成，您可以通过键值，对实例进行二级分类。限制说明每个实例最多可以绑定20个标签，且标签键必须唯一。相同的标签键会被覆盖。每次最多设置50个实例进行批量标签绑定。不同地域的标签信息是独立的。任一标签在解绑后...

创建标签

每个标签由一对键值组成，您可以通过键值，对实例进行二级分类。限制说明每个实例最多可以绑定20个标签，且标签键必须唯一。相同的标签键会被覆盖。每次最多设置50个实例进行批量标签绑定。不同地域的标签信息是独立的。任一标签在解绑后...

逻辑回归

功能说明逻辑回归（LogisticRegression）是一种用于解决二分类（0 or 1）问题的模型，用于估计某种事物的可能性。尽管名字是逻辑回归，但它是一种用于分类而不是回归的线性模型。Logistic 回归在文献中也称为 logit 回归、最大熵分类...

使用可视化大屏查看分析报告

数据可视化分析：相关系数矩阵直方图散点图箱线图数据视图特征工程：线性模型特征重要性随机森林特征重要性模型评估：混淆矩阵聚类模型评估多分类评估二分类评估模型可视化：GBDT二分类 GBDT回归随机森林 XGBoost训练统计分析...

群头像如何修改？

详细信息群头像默认分为二分头像（两人）、三分头像（三人）、四分头像（四人及以上），可以自定义设置头像，但是只支持手机钉钉修改；修改群头像：【群聊天界面】-右上角【群设置】-点击【群头像】进行设置，系统对图片尺寸没有要求，...

创建安全联邦学习任务（任务模式）

包括等频分箱、等距分箱、卡方分箱。处理类型选择分箱处理后，则不能再选择其他处理类型。每个字段只能选择一种分箱处理。数据编码：仅支持用于字符类型。包括 One-hot编码、Binary编码、WOE编码。单击提交，完成任务的创建。步骤三：...

创建标签

每个标签由一对键值组成，您可以通过键值，对实例进行二级分类。限制说明每个实例最多可以绑定20个标签，且标签键必须唯一。相同的标签键会被覆盖。每次最多设置50个实例进行批量标签绑定。不同地域的标签信息是独立的。任一标签在解绑后...

BiPartiteMatching

二分图（BiPartite）是指图的所有顶点可分为两个集合，每条边对应的两个顶点分别属于这两个集合。对于一个二分图G，M是它的一个子图。如果M的边集中任意两条边都不依附于同一个顶点，则称M为一个匹配。二分图匹配（BiPartiteMatching）常...

评分卡预测

输出变量分是否输出每个特征变量所对应的分数，最终的预测总得分为截距项的得分加所有的变量分。执行调优核数目使用的CPU Core数量，默认系统自动分配。每个核的内存大小每个CPU Core所用的内存大小，默认系统自动分配。方式二：PAI...

术语解释

分位数指将一个随机变量的概率分布范围分为几个等份的数值点，常用的有中位数（即二分位数）、四分位数、百分位数等。例如，正态分布的百分位数情况如下图所示：中位数指将样本数据按大小顺序排列起来，形成一个数列，居于数列中间位置的...

基于分箱组件实现连续特征离散化

使用自动分箱时，数据源必须包含 label 字段，且为二分类场景。本文以等频分箱为例。单击画布中的数据转换模块组件，在右侧面板，配置参数（仅配置如下参数，其他参数使用默认值即可）。页签参数描述字段设置不进行转换的数据列 ...

分箱

通过分箱组件可以进行特征离散化，即将连续的数据进行分段，使其变为多个离散化区间。分箱组件支持等频分箱、等宽分箱及自动分箱。配置组件您可以使用以下任意一种方式，配置分箱组件参数。方式一：可视化方式在 Designer 工作流页面配置...

SSML标记语言说明

标签关系标签可以包含文本和以下标签：<break><w><phoneme><say-as>示例<speak><s>这是第一句话</s><s>这是第二句话</s></speak>音频效果：SSML-s.mp3描述使用别名替换标签内文本。语法<sub alias="string"></sub>属性属性名称属性类型 ...

SSML标记语言介绍

标签关系标签可以包含文本和以下标签：<break><w><phoneme><say-as>示例<speak><s>这是第一句话</s><s>这是第二句话</s></speak>音频效果：SSML-s.mp3描述使用别名替换标签内文本。语法<sub alias="string"></sub>属性属性名称属性类型 ...

性能监控指标

耗时分位数分位数，也叫做分位点，是指将一个随机变量的概率分布范围划分为几个等份的数值点，例如中位数（即二分位数）可以将样本数据分为两个部分，一部分的数值都大于中位数，另一部分都小于中位数。相对于平均值，中位数可以有效的...

二分

新品推荐