过滤式特征选择

根据您使用的不同特征选择方法,从所有稀疏或稠密格式的特征数据中选择并过滤出TopN的特征数据,同时保存为特征重要性表,实现了降低模型训练的难度和提高训练模型的精确度。本文为您介绍 Designer 提供的过滤式特征选择组件的参数配置和...

配置LoRa网关

选择 搭建与分享网络 对应的 开始搭建。单击 开始体验。注册网关,填入您的网关基本信息和位置信息后,单击 下一步。网关的GwEUI、PIN Code和频段信息,请在您网关设备的标签上查看。如下图所示。将网关通电、连网。稍等片刻之后,网关状态...

评分卡训练

评分卡是信用风险评估领域常用的建模工具,其原理是通过分箱输入将原始变量离散化后再使用线性模型(逻辑回归或线性回归等)进行模型训练,其中包含特征选择及分数转换等功能。同时也支持在训练过程中为变量添加约束条件。说明 如果未指定...

特征稳定性PSI

PSI也可以用于进行特征选择,选取在不同时间段或不同数据集中分布稳定的特征,避免使用不稳定的特征对模型性能造成负面影响。在联邦学习任务中,PSI是通过联邦建模来实现的,可以保证数据的安全前提下,计算对应两方数据的PSI值。在PSI计算...

箱线图

选择枚举类型特征 选择枚举类型的特征。说明 在 Designer 中仅支持选择一个字段;在 Designer 中支持选择多个字段。分层样本采用数 分层样本的采用数。方式二:PAI命令方式 使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI...

特征离散

页签 参数 描述 字段设置 离散的特征 选择需要离散的特征。标签列 如果您设置了该字段,则可以通过可视化方式查看特征到目标变量的 x-y 分布直方图。参数设置 离散方法 离散方法。取值如下:Isometric Discretization(等距离散)...

特征分组统计

一、组件说明 在联邦学习任务中,对于数值类特征,用户通常会关注特征的分组统计值,【特征数值统计】组件主要用于数值类特征的分组统计分析。在分组统计计算完成后,用户可以右键组件,选择【查看节点数据报告】,来查看数据的分组统计...

特征数值统计

一、组件说明 在联邦学习任务中,对于数值类特征,用户通常会关注一些统计类特征,例如最大值、最小值、平均值等,【特征数值统计】组件主要用于数值类特征的分析。在数值统计计算完成后,用户可以右键组件,选择【查看节点数据报告】,来...

决策树

均方误差:父节点和子节点之间的均方误差的差额将被用来作为特征选择的标准,这种方法通过使用叶子节点的均值来最小化L2损失。费尔德曼均方误差:它使用费尔德曼均方误差,这种指标使用费尔德曼针对潜在分枝中的问题改进后的均方误差。平均...

随机森林

均方误差:父节点和子节点之间的均方误差的差额将被用来作为特征选择的标准,这种方法通过使用叶子节点的均值来最小化L2损失。平均绝对误差:它使用叶节点的中值来最小化 L1 损失。否 均方误差 均方误差 平均绝对误差 其他参数 参数名 参数...

VPC接入

然后在顶部菜单栏选择搭建的VPC网络所在地域。在 交换机 页面,查看目标交换机ID和VPC ID。实例ID/名称 列出了交换机ID。专有网络 列出了交换机所在的VPC ID。步骤三:部署实例 在 云消息队列 Kafka 版 控制台 的 实例列表 页面,找到 未...

公网和VPC接入

然后在顶部菜单栏选择搭建的VPC网络所在地域。在 交换机 页面,查看vSwitch ID和VPC ID。步骤三:部署实例 在 云消息队列 Kafka 版 控制台 的 实例列表 页面,找到 未部署 的实例,单击右侧 操作 列的 部署。在 部署实例 面板,配置以下...

GBDT二分类V2

两个组件当前的功能和参数支持情况,见下表:PS-SMART二分类参数 对应本组件的参数 是否稀疏格式 是否为稀疏向量格式 选择特征选择特征选择标签列 选择标签列 选择权重列 选择权重列 评估指标类型 不适用,默认为 AUC 指标,可以在 ...

特征管理

添加特征表 创建 行业模板 之后,进入开放搜索 控制台 页面,左侧导航栏选择:OpenSearch行业算法版>搜索算法中心>特征管理,然后点击 添加特征表 按钮:在添加MaxCompute特征表窗口,填写 特征表名称,选择相应的MaxCompute 数据源,并...

Spark Connector

您也可以选择搭建在Windows操作系统下,详情请参见 搭建Windows开发环境。重要 Spark包请使用Spark3.3.x版本,单击 Spark 下载并解压到本地目录。下载并编译Spark Connector(当前只支持Spark 3.3.x版本)。说明 如果您编译时遇到网络等...

条件随机场

Dlifecycle=28-DcoreNum=10 参数名称 是否必选 描述 默认值 inputTableName 是 输入特征数据表 无 inputTablePartitions 否 输入特征选择的分区 全表 featureColNames 否 输入表选择特征列 默认选择全部,自动排除label列。...

定制排序模型

并 添加排序模型特征(需填写 排序模型特征名称,选择 排序模型特征类型 和 选择特征,参考:特征管理),点击 确定 即可:说明 排序模型特征类型参考:定制排序模型特征配置规范 选择特征参考:系统内置基础特征 创建模型描述流程 创建 独...

PS线性回归

页签 参数 描述 字段设置 选择特征列 输入数据源中,参与训练的特征列。选择标签列 支持DOUBLE及BIGINT类型。是否稀疏格式 使用KV格式表示稀疏格式。kv间的分隔符 默认使用空格分隔。key与value分隔符 默认使用半角冒号(:)分隔。参数设置...

随机森林特征重要性

页签 参数 描述 字段设置 选择特征列 输入表中,用于训练的特征列。默认选中除Label外的所有列,为可选项。选择目标列 该参数为必选项。单击 图标,在 选择字段 对话框中,输入关键字搜索列,选中后单击 确定。参数设置 并行计算核数 并行...

条件随机场预测

选择特征列 要进行标注的单词,以及该单词对应的特征。请选择目标列 选择目标列。预测结果列列名 预测结果列的名称,默认值为prediction_result。预测分数列列名 预测分数列的名称,默认值为prediction_score。预测详细列列名 预测详细列...

线性模型特征重要性

页签 参数 描述 字段设置 选择特征列 输入表中,用于训练的特征列。默认选中除标签列(例如Label)外的所有列,为可选项。选择目标列 该参数为必选项。单击 选择字段,选择标签列。输入表数据是否为稀疏格式 可选项。执行调优 计算核心数 ...

PS-SMART二分类训练

右键单击 PS-SMART二分类训练-1 组件,在快捷菜单,选择 查看数据>输出特征重要性表,查看特征重要性表。其中:id:表示传入的特征序号。因为该示例传入的特征为 f0、f1、f2、f3、f4 及 f5,所以 id 列的 0 表示 f0 特征列,id 列的 4 表示...

PS-SMART回归

右键单击 PS-SMART回归-1 组件,在快捷菜单,选择 查看数据>输出特征重要性表,查看特征重要性。其中 id 列表示传入的特征序号。因为该示例的输入数据是KV格式,所以 id 列表示KV对中的 key。该特性重要性表中仅有2个特性,表示树在分裂...

数据视图

页签 参数 描述 字段设置 选择特征列 用来表现训练样本数据特征的列。选择目标列 用来进行训练样本数据的目标列。枚举特征 勾选的特征将被视作枚举特征处理。k:v,k:v稀疏数据格式 是否采用KV格式的稀疏数据。参数设置 连续特征离散区间数 ...

PS-SMART多分类

选择特征列 输入表中,用于训练的特征列。如果输入数据是Dense格式,则只能选择数值(BIGINT或DOUBLE)类型。如果输入数据是Sparse KV格式,且 key 和 value 是数值类型,则只能选择STRING类型。选择标签列 输入表的标签列,支持STRING及...

主成分分析

页签 参数 描述 字段设置 选择特征列 输入表中用于分析的列名称。附加列 附加在降维数据表后的列。参数设置 信息量比例 降维后数据信息占原来的比例。特征分解方式 分解特征的方式,取值如下:CORR COVAR_SAMP COVAR_POP 数据转换方式 转换...

配置FeatureStore项目

FeatureStore 项目会对应一个离线数据源和在线...参数 说明 选择特征 选择当前离线视图中的特征,并配置特征别名。Label表名称 选择已创建的Label表名称。导出表名 提交后,后续会在MaxCompute中自动创建一张 train set 表,用于离线训练。

新建特征

本文介绍在蚂蚁隐私计算服务平台新建特征组的方法。操作步骤 登录 蚂蚁隐私计算服务平台。在左侧导航栏,选择 我的资源>数据资产。...类型 特征类型选择 STRING 或 DOUBLE。描述 选填,描述内容总长度不超过 64 个字符。配置完成后单击 确定。

评分卡预测

页签 参数 描述 字段设置 特征选择用于预测的原始特征列,默认选择全部。原样添加到结果表 选择不进行任何处理,直接附加到预测结果表中的列。例如ID列和目标列等。输出变量分 是否输出每个特征变量所对应的分数,最终的预测总得分为...

特征异常平滑

nr_employed 5228.1 5195.8 4991.6 5099.1 5076.2 5228.1 5099.1 5099.1 5076.2 5099.1 参数配置 平滑特征 选择 nr_employed,参数设置 中 平滑方法 选择 阈值平滑,阈值下限 为 5000,阈值上限 为 6000,如下图所示。运行结果 nr_employed...

全域分析

特征分布 选择受众后,单击 特征分布 页签,单击 选择标签,在弹窗中选择一个或多个全域标签,页面将展示当前受众的特征分布情况。交叉分析 交叉分析用于分析两个全域标签的不同标签值组合在受众中的分布。选择受众后,单击 交叉分析 页签...

统一投递审计日志

您可以将资源目录中所有成员的操作审计日志和配置审计日志统一投递到指定的日志账号,可以选择投递到对象存储OSS实现长期存储,也可以投递到日志服务SLS实现实时的日志分析。统一投递审计日志,方便专职审计人员查询和分析审计日志。背景...

异常检测

页签 参数 描述 字段设置 特征选择需要分析的字段。异常检测方法 选择检测的方法。箱型图用于检测连续类特征。AVF用于检测枚举类特征。方式二:PAI命令方式 使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI命令调用,...

特征尺度变换

选择标签列 如果您设置了该字段,则可以通过可视化方式查看特征到目标变量的 x-y 分布直方图。是否K:V,K:V稀疏特征 训练数据是否为稀疏格式。当数据以稀疏格式存储时,通常所有数据存储在一个字段里,而不是每个数据单独存储在一个字段里。...

购买组合套餐(服务器+负载均衡)

搭建网站 如果您选择阿里云提供的系统镜像创建了服务器,您需要自行搭建开发环境或者部署应用程序。轻量应用服务器 提供了部分搭建环境、搭建网站、数据迁移以及高可用架构的最佳实践,您可以根据实际需求,参考相应文档完成服务器的搭建。...

数据转换模块

页签 参数 描述 字段设置 输入表选择特征列 输入的特征列,默认选择全表。不进行转换的数据列 选中的列会原样输出,可以在此指定Label。数据转换的类型 支持的转换类型包括 归一化、离散化、转换为WOE值 及 Index。默认WOE值 仅当 数据...

基于分箱组件实现连续特征离散化

页签 参数 描述 字段设置 特征选择 f1、f2、f3 及 f4 列。参数设置 分箱个数 配置为 10,表示将连续特征离散化至10个区间中。分箱方式 支持 等频、等宽 及 自动分箱。使用 自动分箱 时,数据源必须包含 label 字段,且为二分类场景。...

创建轻量应用服务器

重要 当您参考云服务器ECS的建站教程在轻量应用服务器上手动建站时,建议您选择手动搭建网站或应用的教程,并且教程中所选用的操作系统版本信息需要和轻量应用服务器的系统镜像版本信息一致。否则可能因为版本不兼容等原因导致运行命令报错...

统一配置身份权限

选择蓝图,然后单击 搭建。本文以标准蓝图为例。在 配置蓝图 页面的 已添加搭建项 区域,单击 云SSO。说明 如果 已添加搭建项 中没有目标搭建项,您可以单击 添加搭建项,添加目标搭建项。配置云SSO参数。在 基本信息 区域,设置以下参数:...

使用云盒

镜像 类型:公共镜像 镜像:Alibaba Cloud Linux 2.1903 LTS 64位 选中安全加固 选择用于搭建实例环境的镜像。存储 系统盘:ESSD PL0云盘,40GiB 可供选择的存储类型和容量由购买的块存储资源决定。网络和安全组 网络 VPC:vpc-bp1opxu1...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云服务器 ECS 云虚拟主机 Web应用防火墙 对象存储 轻量应用服务器 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用