特征离散

取值如下:Isometric Discretization(等距离散)Isofrequecy Discretization(等频离散)Gini-gain-based Discretization(基于Gini增益离散)Entropy-gain-based Discretization(基于增益离散离散区间个数 离散区间的个数。...

物模型TSL字段说明

说明 为了完整展示TSL的结构,以下示例中包含所有参数,不代表实际使用中可能出现的组合。参数后的文字为参数说明,非参数值。各参数的使用场景,请参见参数说明。{"schema":"物模型结构定义的访问URL。profile":{"productKey":"当前...

Echarts 热力图

最大值:坐标轴刻度最大值,默认值为 数据最大值,表示取数据在该轴上的最大值作为最大刻度。不设置时会自动计算最大值保证坐标轴刻度的均匀分布。自动伸缩:勾选后,坐标刻度不会强制包含零刻度。只在数值轴中有效,设置了最大值和最小值...

使用ping命令丢包或不通时的链路测试方法

当客户端访问目标服务器或负载均衡,使用ping命令测试出现丢包或网络不通时,可以通过链路测试工具进行链路测试来判断问题来源。本文介绍如何使用链路测试工具进行链路测试。链路测试流程 通常情况下,链路测试流程如下图所示。链路测试...

列存索引如何实现高效数据过滤

统计信息剪枝:由于写入时不排序,统计信息对于数据分布离散均匀的场景效果比较差,有以下优化方案:减小pack大小。对于minmax与Bloom filter来说,更小的pack意味着更细粒度的索引,通常也具有更好的剪枝效果。IMCI支持调整表的列索引pack...

Echarts 颜色分段折线图

坐标轴:坐标轴触发,主要在柱状图,折线图等会使用类目轴的图表中使用。不触发:什么都不触发。坐标轴指示器:单击右侧的 眼睛 图标显示坐标轴指示器。类型:指示器类型,包括 直线指示器、阴影指示器 和 交叉指示器。自动吸附:勾选后,...

Echarts 颜色分段折线图

坐标轴:坐标轴触发,主要在柱状图,折线图等会使用类目轴的图表中使用。不触发:什么都不触发。坐标轴指示器:单击右侧的 眼睛 图标显示坐标轴指示器。类型:指示器类型,包括 直线指示器、阴影指示器 和 交叉指示器。自动吸附:勾选后,...

MaxCompute安全白皮书

法律声明 阿里云提醒您在阅读或使用本文档之前请仔细阅读、充分理解本法律声明各条款的内容。如果您阅读或使用本文档,您的阅读或使用行为将被视为对本声明全部内容的认可。您应当通过阿里云网站或阿里云提供的其他授权通道下载、获取本...

常用时序函数

本文介绍时序SQL中支持的常用函数和使用示例。引擎与版本 常用时序函数仅适用于时序引擎。时序引擎3.4.7及以上版本支持常用时序函数。如何查看或升级当前版本,请参见 时序引擎版本说明 和 升级小版本。常用时序函数列表 函数 说明 CURRENT...

创建压测场景

使用PTS平台执行JDBC压测的优势 全球分布施压机,即压即,可支持百万并发,千万QPS压测。支持吞吐量模式,可以设置全局目标QPS,更直观衡量服务端性能。支持压测中调速,可以灵活调整并发或QPS,不断逼近性能极限点。针对分布式压测,...

数据视图

参数设置 连续特征离散区间数 连续性特征等距离划分最大区间数。执行调优 计算核心数 计算的核心数,取值范围为正整数。每个核心内存 每个核心的内存,取值范围为1 MB~65536 MB。方式二:PAI命令方式 使用PAI命令方式,配置该组件参数。您...

CopyObject

x-oss-server-side-encryption 字符串 否 AES256 指定OSS创建目标Object时,服务器端使用熵编码加密算法。取值:AES256、KMS 说明 在OSS ON云盒使用场景中,仅支持AES256。您只有购买了KMS套件,才能使用KMS加密算法,否则OSS会返回...

蓝牙Mesh本地定时统一协议

设备对时请求失败后重试最大间隔:5分钟,采用了时间离散方式,第一次对时请求失败间隔1分钟,第二次对时请求失败间隔3分钟,第三次对时请求失败间隔5分钟。设备对时请求失败重试次数:3次。注意事项 在无精灵音箱/网关在线的情况下,APP...

低成本RDS历史库

云原生多模数据库 Lindorm 和关系型数据库同时使用时可以满足低存储成本,方便运维,弹性伸缩等需求,本文介绍其方案架构和优势。重要 2023年3月10日后购买的LTS 不再支持低成本RDS历史库场景,2023年3月10日前购买的LTS仍支持该场景。背景...

应用场景:低成本历史库

云原生多模数据库 Lindorm 和关系型数据库同时使用时可以满足低存储成本,方便运维,弹性伸缩等需求,本文介绍其方案架构和优势。重要 2023年3月10日后购买的LTS 不再支持低成本历史库场景,2023年3月10日前购买的LTS仍支持该场景。背景...

Designer使用案例汇总

基于分箱组件实现连续特征离散化 介绍如何使用分箱组件进行连续特征离散化。人口普查统计案例(旧版)以人口普查数据为例,根据人物年龄、工作类型及教育程度等属性,快速构建学历对收入影响的统计模型。预测学生考试成绩 基于中学生的家庭...

多元索引最佳实践

主键需要尽可能的离散,例如使用MD5进行哈希处理。常见的反例包括使用自增ID、当前时间戳作为分区键。关于主键设计的更多信息,请参见 表设计。如果需要在数据表上根据主键前缀进行批量数据的拉取,则可以进行一些特殊的主键设计,然后查询...

评分卡训练

评分卡是信用风险评估领域常用的建模工具,其原理是通过分箱输入将原始变量离散化后再使用线性模型(逻辑回归或线性回归等)进行模型训练,其中包含特征选择及分数转换等功能。同时也支持在训练过程中为变量添加约束条件。说明 如果未指定...

向量计算函数

向量计算函数列表 重要 以下函数中使用的向量元素,可以特定格式的字符串来描述,字符串是"[]"或者"{}"包起来的一组数字,数字之间逗号分隔开。函数名称 语法 说明 支持SQL 支持SPL 余弦相似度函数 cosine_similarity(array(double)...

范围类型

你可以使用 btree_gist 扩展来在纯标量数据类型上定义排除约束,然后把它和范围排除结合可以得到最大的灵活性。例如,安装 btree_gist 之后,只有会议室号码相等时,下列约束将拒绝重叠的范围:CREATE EXTENSION btree_gist;CREATE TABLE ...

ModifyInstanceAttribute-修改一台实例的部分信息

其他类型实例(Linux 等):长度为 2-64 个字符,允许使用半角句号(.)分隔字符成多段,每段允许使用大小写字母、数字或连字符(-),但不能连续使用半角句号(.)或短划线(-)。不能以半角句号(.)或短划线(-)开头或结尾。...

eRDMA概述

最大的发送SGE数目max_send_sge 6 单个send wr支持的离散地址数目。最大的接收SGE数目max_recv_sge 1 单个recv wr支持的离散地址数目。SRQ 不支持 无。QP类型 RC(Reliable Connected)无。建链方式 RDMA_CM 无。RDMA CQ的基本规格 规格...

使用介绍

自定义函数UDF的相关使用说明。UDF列表 函数名 功能简介 contain 判断字段值在给定集合内,支持单值和多值 notcontain 判断字段值不在给定集合内,支持单值和多值 MATCHINDEX 使用给定的条件查询指定字段的倒排索引 QUERY 使用给定的条件...

基础统计分析

二、诊断报告 下面demo数据演示了基础统计分析报告,其中展示了每天的用户量,展示了多个bigint特征从最大值最小值、百分位数、频数统计等多个角度的分析报表。诊断结果中显示空值率大于0.4,需要关注city字段。展示每天的数据总量 唯一...

GetObject

名称 类型 描述 x-oss-server-side-encryption 字符串 若Object在服务器端采用编码加密存储,使用GET请求时,系统会自动解密返回给用户,并且在响应头中返回x-oss-server-side-encryption,表明该Object的服务器端加密算法。x‑oss‑...

组件参考:所有组件汇总

组件类型 组件 描述 自定义组件 自定义组件 支持在AI资产管理中创建自定义组件,自定义组件创建成功后,您可以在Designer中将该组件与官方组件串联使用进行模型训练。源/目标 读OSS数据 该组件用来读取对象存储OSS Bucket路径下的文件或...

分区合并

全局索引:使用另一个维度进行水平分区的数据与主表始终保持强一致的分区表。语法 ALTER { TABLE tbl_name|TABLEGROUP tg_name|TABLEGROUP BY TABLE tbl_name } merge_partition_specs_definition|merge_subpartition_specs_definition ...

交互分析管理

添加数值类型 说明 使用单一或范围滑块来创建单一数值或一对范围数值变量,适用于使用数值列筛选数据源。单击 添加参数,打开 新建SQL参数 窗口。选择 数值类型,单击 下一步。请根据表格内容,填写配置项。模块 参数 说明 SQL过滤方式 ...

朴素贝叶斯

朴素贝叶斯是一种基于独立假设的贝叶斯定理的概率分类算法。使用Designer(原Studio)的朴素贝叶斯组件,您能有效处理多样的分类问题。本文为您介绍朴素贝叶斯组件的配置方法。使用限制 支持的计算引擎为MaxCompute。组件配置 您可以使用...

联邦预处理

离散离散化是对特征进行离散化处理,目前仅支持等宽分桶。函数路径 fascia.biz.preprocessing.discretize 函数定义 def discretize(fed_df:HDataFrame,columns:List[str]=None,n_bins=5,strategy='uniform',discretizer:...

GetRegionConfiguration

请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 GET/openapi/region HTTP/1.1 请求参数 名称 类型 位置 是否必选 示例值 描述 zoneId String Query 否 cn-hangzhou-f 当前可用区ID。返回数据 名称 类型 ...

分箱

一、组件说明 分箱(Binning)是一种数据预处理方法,用于将连续数据转化为离散数据。分箱的目的是为了减少异常值的影响和简化模型的复杂度,同时提高模型的稳定性和可解释性。分箱的基本思路是将一段连续的数据划分为几个区间或者桶,然后...

横向分箱

一、组件说明 横向分箱(HomoBinning),是一种横向场景下的数据预处理方法,用于将连续数据转化为离散数据。分箱的目的是为了减少异常值的影响和简化模型的复杂度,同时提高模型的稳定性和可解释性。横向分箱的基本思路是将一段连续的数据...

PS-SMART回归

GBDT类算法适合直接使用连续特征进行训练,除需要对类别特征进行One-Hot编码(筛除低频特征)外,不建议对其他连续型数值特征进行离散化。PS-SMART算法会引入随机性。例如,data_sample_ratio 及 fea_sample_ratio 表示的数据和特征采样、...

GBDT二分类V2

500 最大分箱个数 否 连续特征进行离散分箱时的最大分箱个数。该值越大,进行节点分裂时越精确,但计算代价越大。32 最多类别数 否 类别型特征最多允许的类别个数:对于一个类别型特征,所有出现的值按频率从高到低排序后,序位多于该值的...

查看内置规则模板

重要 您需要购买DataWorks企业版及以上版本,才可以使用动态阈值。内置模板规则说明 内置模板分为表级和字段级的模板规则,支持您通过内置规则模板来快速为一批表批量创建数据质量规则。详情请参见:配置规则:按表(单表)、配置规则:按...

气泡图(v3.0以下版本)

图表样式 气泡图是散点图的一种,与散点图相比,气泡图使用气泡来展示数据,且可以自定义气泡的大小,能够直观生动地展示多个时间下离散数据的差异。配置面板 搜索配置:单击 配置 面板右上角的 搜索配置,可在 搜索配置 面板中输入您需要...

气泡图(v3.x版本)

气泡图是散点图的一种,与散点图相比,气泡图使用气泡来展示数据,且可以自定义气泡的大小,能够直观生动地展示多个时间下离散数据的差异。本文介绍气泡图各配置项的含义。配置 重要 本文介绍v3.x版本的气泡图的配置项,如需查看v3.0以下...

PS-SMART二分类训练

GBDT类算法适合直接使用连续特征进行训练,除需要对类别特征进行One-Hot编码(筛除低频特征)以外,不建议对其他连续型数值特征进行离散化。PS-SMART算法会引入随机性。例如,data_sample_ratio 及 fea_sample_ratio 表示的数据和特征采样...

生产者负载均衡

策略特点 RoundRobin模式的生产者负载均衡策略仅适用于无顺序性的消息,该模式下是以消息为粒度进行轮询负载,因此消息能够尽可能实现均匀分布,使得主题的传输能力尽可能达到最大使用示例 RoundRobin模式不需要额外设置,对于非顺序类型...
共有6条 < 1 2 3 4 ... 6 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储 物联网平台
新人特惠 爆款特惠 最新活动 免费试用