过滤式特征选择

根据您使用的不同特征选择方法,从所有稀疏或稠密格式的特征数据中选择并过滤出TopN的特征数据,同时保存为特征重要性表,实现了降低模型训练的难度和提高训练模型的精确度。本文为您介绍 Designer 提供的过滤式特征选择组件的参数配置和...

明细数据层(DWD)

基于阿里巴巴方法论最佳实践,事实表(事实模型,又称事实逻辑表)作为数据仓库维度建模的核心,紧紧围绕着业务过程进行设计。业务过程是通过事实表的度量、引用的维度与业务过程有关属性的方式获取。Dataphin支持两种类型的事实表:事务型...

基于函数计算创建自定义规则

本文通过编写函数代码检测ECS实例中的CPU核数为例,为您介绍基于函数计算创建自定义规则的完整操作流程。前提条件 请确保您已开通函数计算服务。具体操作,请参见 开通服务。说明 关于函数计算服务的收费标准,请参见 计费概览。背景信息 ...

基于条件创建自定义规则

当配置审计预置的规则模板不能满足需求时,您可以通过可视化设置条件规则的三要素(资源特征、操作符和预期值),快速创建自定义规则,对目标资源进行审计。背景信息 关于自定义条件规则的概念、应用场景和核心特性,请参见 自定义条件规则...

评分卡训练

评分卡是信用风险评估领域常用的建模工具,其原理是通过分箱输入将原始变量离散化后再使用线性模型(逻辑回归或线性回归等)进行模型训练,其中包含特征选择及分数转换等功能。同时也支持在训练过程中为变量添加约束条件。说明 如果未指定...

检测响应常见问题

基于MD5和路径加白 云产品威胁检测 支持在控制台配置加白规则 进程异常行为 基于命令行加白 持久化后门 基于文件MD5和特征加白 敏感文件篡改 基于文件路径加白 应用入侵事件 基于命令行加白 Web应用威胁检测 基于域名或URL加白 异常网络...

黄牛账号识别之GraphCompute解决方案

工业界比较知名的基于半监督关系网络图上的风险实体挖掘方法有亚马逊在2018年提出的GraphRAD方法和蚂蚁集团在2021年提出的Risk-alike方法,这两种方法都是基于黑种子节点的输入在图上挖掘风险。也可以使用 链接分析 的方法,如PageRank,从...

IDMapping在离线一体化解决方案

(一)背景介绍 对于几乎所有的互联网企业,对于识别、追踪用户身份都有强烈的需求,精准识别用户身份后,就可以收集用户个性化的行为、身份数据,比如用户浏览了什么商品,看了什么视频,去了哪个餐厅等等,从而可以对搜索,广告,推荐...

多轮对话搜索

服务创建 单击快速创建,选择多轮对话搜索,进入服务创建界面,编辑服务名称并选择服务所使用的引擎,完成创建中进入索引配置 引擎 提供检索服务的基础组建,可在资源中心进行引擎管理也可在快速创建页面直接选择或添加。更多信息可查看...

特征稳定性PSI

PSI也可以用于进行特征选择,选取在不同时间段或不同数据集中分布稳定的特征,避免使用不稳定的特征对模型性能造成负面影响。在联邦学习任务中,PSI是通过联邦建模来实现的,可以保证数据的安全前提下,计算对应两方数据的PSI值。在PSI计算...

特征离散

特征离散算法组件是将连续特征按照一定的规则进行离散化。功能介绍 离散模块的功能如下:支持稠密...离散特征选择 nr_employed,离散方法选择 等距离散,离散区间个数配置为 5。运行结果 nr_employed 4.0 3.0 1.0 3.0 2.0 4.0 3.0 3.0 2.0 3.0

K近邻

基于邻居的方法被称为非泛化机器学习方法,因为它们只是“记住”其所有训练数据。参数说明 IN端口 参数名 参数描述 是否必填 输入数据类型 数据源类型 特征变量 配置模型特征列 是 整数或浮点数 说明 若存在非数值数据,则会抛出异常。CSV...

箱线图

选择枚举类型特征 选择枚举类型的特征。说明 在 Designer 中仅支持选择一个字段;在 Designer 中支持选择多个字段。分层样本采用数 分层样本的采用数。方式二:PAI命令方式 使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI...

在FeatureStore中使用自动特征工程(AutoFE)

模型训练 基于特征分析生成配置和数据,对pipeline流程进行训练,生成模型用于离在线均可使用的模型。特征转换 加载pipeline模型,对训练和测试数据进行特征转换,生成对应的特征工程结果。计费说明 AutoFE本身不收费,但在进行预处理、...

基于对象特征的推荐

本文为您介绍如何基于对象特征进行商品推荐。前提条件 已创建工作空间,详情请参见 创建工作空间。背景信息 该工作流首先对一份真实电商的4月份和5月份数据进行模型训练并生成预测模型,然后通过6月份的购物数据对该预测模型进行评估,最终...

决策树

均方误差:父节点和子节点之间的均方误差的差额将被用来作为特征选择的标准,这种方法通过使用叶子节点的均值来最小化L2损失。费尔德曼均方误差:它使用费尔德曼均方误差,这种指标使用费尔德曼针对潜在分枝中的问题改进后的均方误差。平均...

符号映射

符号映射器 单击 图标,打开符号映射配置项。符号基于:自定义选择基于当前图层下数据表中的符号映射字段。符号映射:自定义修改每个分段下的符号、类型和数据条数,并支持添加和删除分段。

随机森林

均方误差:父节点和子节点之间的均方误差的差额将被用来作为特征选择的标准,这种方法通过使用叶子节点的均值来最小化L2损失。平均绝对误差:它使用叶节点的中值来最小化 L1 损失。否 均方误差 均方误差 平均绝对误差 其他参数 参数名 参数...

通用联邦学习模板

一、模板说明 通过提供通用机器学习模板,展示完整的数据收集、特征工程、模型选择和训练、模型评估、模型部署和应用以及模型复用的一系列算子的使用方法,使用户能够高效构建准确的联邦学习模型。二、使用步骤 通过提供通用机器学习模板,...

特征分组统计

一、组件说明 在联邦学习任务中,对于数值类特征,用户通常会关注特征的分组统计值,【特征数值统计】组件主要用于数值类特征的分组统计分析。在分组统计计算完成后,用户可以右键组件,选择【查看节点数据报告】,来查看数据的分组统计...

安全联邦学习-工作流FL

一、什么是安全联邦学习-工作流模式 功能介绍:通过工作流的模式,在原始数据不出域的前提下,通过交换各个参与方的算法训练的中间结果梯度、参数信息,或完全在密文条件下进行计算,从而发挥参与多方数据样本更丰富、更全面的优势,得出更...

特征数值统计

一、组件说明 在联邦学习任务中,对于数值类特征,用户通常会关注一些统计类特征,例如最大值、最小值、平均值等,【特征数值统计】组件主要用于数值类特征的分析。在数值统计计算完成后,用户可以右键组件,选择【查看节点数据报告】,来...

组件参考:所有组件汇总

过滤式特征选择 该组件将根据您使用的不同特征选择方法,从所有稀疏或稠密格式的特征数据中选择并过滤出TopN的特征数据。特征编码 该组件是将非线性特征通过GBDT编码成线性特征。one-hot编码 您可以通过该组件后数据会变成稀疏,输出结果也...

测试服务

请求方法 该所属类的请求方法,如果包含多个请求方法,在列表中选择其中一种方法,只能单选。专有网络VPC 选择应用所在的ECS或集群的VPC。虚拟交换机 选择虚拟交换机。安全组 选择应用所在的ECS或集群的安全组。测试参数 在测试方法的参数...

特征管理

特征管理介绍 OpenSearch推出了定制排序模型功能,特征管理可用于为定制排序模型添加所需的特征表,并支持创建、编辑特征名称、特征类型以及来源字段。添加特征表 创建 行业模板 之后,进入开放搜索 控制台 页面,左侧导航栏选择:...

条件随机场

Dlifecycle=28-DcoreNum=10 参数名称 是否必选 描述 默认值 inputTableName 是 输入特征数据表 无 inputTablePartitions 否 输入特征选择的分区 全表 featureColNames 否 输入表选择特征列 默认选择全部,自动排除label列。...

线性支持向量机

支持向量机SVM(Support Vector Machine)是基于统计学习理论的一种机器学习方法,通过寻求结构风险最小化,提高学习机泛化能力,从而实现经验风险和置信范围最小化。本文介绍线性支持向量机算法组件的配置方法及使用示例。背景信息 本文中...

单波段拉伸

本文介绍图层栅格数据选择的栅格符号为单波段拉伸时的参数配置。前提条件 已登录DataV-Atlas管理控制台。已进入项目编辑页面。样式 基础 可见缩放等级:级别表示地图的缩放层级,地图的缩放层级在设置范围内数据点将显示,范围外将隐藏。...

定制排序模型

并 添加排序模型特征(需填写 排序模型特征名称,选择 排序模型特征类型 和 选择特征,参考:特征管理),点击 确定 即可:说明 排序模型特征类型参考:定制排序模型特征配置规范 选择特征参考:系统内置基础特征 创建模型描述流程 创建 独...

PS线性回归

页签 参数 描述 字段设置 选择特征列 输入数据源中,参与训练的特征列。选择标签列 支持DOUBLE及BIGINT类型。是否稀疏格式 使用KV格式表示稀疏格式。kv间的分隔符 默认使用空格分隔。key与value分隔符 默认使用半角冒号(:)分隔。参数设置...

Cost-based SQL诊断引擎

能力测试集构建的基本思想,首先通过特征化实现测试案例基于特征的形式化描述,形成测试案例形式化特征库,并具备足够的完备性。在阿里巴巴集团内部,我们已经对数据库实例上全部SQL进行实时采集和存储,借助阿里巴巴这个大平台业务的丰富...

EdgeTab

close close()方法描述 关闭浏览器对象 调用样例-rpa.app.edge.EdgeTab.close-#注意事项:此方法需要确认已安装并启用Aliyun RPA对应的edge扩展插件#此方法需要基于EdgeTab实例对象进行操作#代码调用样例如下:page=rpa.app.edge.create('...

SE360Tab

close close()方法描述 关闭浏览器对象 调用样例-rpa.app.se360.SE360Tab.close-#注意事项:此方法需要确认已安装并启用Aliyun RPA对应的se360扩展插件#此方法需要基于SE360Tab实例对象进行操作#代码调用样例如下:page=rpa.app.se360....

案例:搭建以图搜图系统

您可以选择适合当前使用场景的方法,提取图像的特征,生成特征向量。向量检索 向量检索又称为最近邻(Nearest Neighbor Search,NNS)检索,主要负责在海量特征向量中快速地查找与查询向量距离最近的k个记录。虽然可以通过遍历的方法,依次...

随机森林特征重要性

您可以使用原始数据和随机森林模型,计算特征重要性。组件配置 您可以使用以下任意一种方式,配置随机森林特征重要性组件参数。方式一:可视化方式 在 Designer 工作流页面配置组件参数。页签 参数 描述 字段设置 选择特征列 输入表中,...

在GPU实例上使用RAPIDS加速图像搜索任务

您可以选择一种方法设置GPU显存参数:方法1:依据运行需求进行显存分配。config.gpu_options.allow_growth=True 方法2:设定可以使用的GPU显存比例。本案例中使用方法2,并且GPU显存比例默认设置为0.3,即Tensorflow可以使用整块GPU显存的...

财务规划

计费方式选型和组合模型 企业可以根据自身业务特征选择合理的计费方式组合,从而实现云上成本更优。以下列举几项对成本管理较为相关的计费方式。企业使用按量付费的方式购买产品,企业只需按实际使用量付费而不用提前采购,有助于保持资源...

配置限速流程组件

本文为您介绍如何配置限速流程...速度上限 选择数据传输的速度上限:如果您选择 基于数据量限制,则需选择 1M/s、2M/s、5M/s、10M/s。如果您选择 基于数据条数限制,则需填写限制的条数,例如30条/s。单击确定,完成限速流程组件的属性配置。

配置限速流程组件

速度上限 选择数据传输的速度上限:如果您选择 基于数据量限制,则需选择 1M/s、2M/s、5M/s、10M/s。如果您选择 基于数据条数限制,则需填写限制的条数,例如30条/s。单击 确认,完成 限速 流程组件的属性配置。后续步骤 完成流程组件的...

全域分析

全域分析功能结合全域标签能力,对存量用户提供丰富、灵活的洞察分析能力,可实现全量用户、细分用户多维度、多形态的分析方法,满足业务人员对用户的全方位理解。用户概览 页面上方展示:累计已接入用户资产:即存量用户数,是当前空间下...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
Web应用防火墙 物联网无线连接服务 对象存储 轻量应用服务器 云服务器 ECS 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用