相关性分析

皮尔逊相关系数:用于衡量两个数据集是否在一条线上面,即针对线性数据的相关系数计算,针对非线性数据便会有误差。肯德尔相关系数:用于反映分类变量的相关性,即针对无序序列的相关系数计算,非正太分布的数据。斯皮尔曼相关系数:用于非...

主备方案介绍

云数据库HBase存储海量大数据,在业务场景中往往承载着重要数据,为保障数据的高可用性和安全性,云数据库HBase提供了主备双活和主备容灾特性。本文介绍云数据库HBase的主备双活和主备容灾特性功能。使用场景 主备双活:大数据量随机读响应...

产品优势

(IO hang是指在系统运行过程中,因某些IO耗时过长而引起的系统不稳定甚至宕机)最大容量32TB。需要上层集群文件系统进行扩容,扩容复杂,扩容周期长,不支持在线扩容。最大容量1PB。易用性 兼容POSIX文件接口,部署简单,挂载即用。需要...

调试实时任务

Session集群调试方式:即通过Session集群进行调试,调试的数据为 线上的真实数据 且为 流式数据(即来源表中写入数据时,将直接输出该条数据的计算结果,与真实线上运行任务的结果一致)。该方式下,Session集群提供Flink任务状态、日志和...

查询结果不符合预期的常见原因

只要写入过程中没有出现报错,相应的数据一定会写入成功,即使遇到机器宕机等情况,都可以通过恢复WAL的方式恢复数据,保障数据的持久性,不会出现数据写入后预期不可见的情况。但是由于宽表引擎的特性比较多,例如数据版本号、时间戳、...

TRUNCATE

待清空数据的非分区表的名称。清空分区数据 清空分区表中指定分区的数据。MaxCompute支持通过条件筛选方式清空分区数据。如果您希望一次性删除符合某个规则条件的一个或多个分区,可以使用表达式指定筛选条件,通过筛选条件匹配分区并批量...

调度依赖配置指引

DataWorks周期性调度产出数据的表包括但不限于以下几类:实时同步产出的表 从本地上传到DataWorks的表 维表 手动任务产出的表 DataWorks上调度节点产出的周期性变更的表 DataWorks周期性调度产出数据的表,可自定义依赖关系,关于...

逻辑回归

计算逻辑原理 逻辑回归的思路是,先拟合决策边界(不局限于线性,还可以是多项式),再建立这个边界与分类的概率联系,从而得到了二分类情况下的概率。本质是假设数据服从这个分布,然后使用极大似然估计做参数的估计。参数说明 IN端口 ...

数据安全治理的难点

通常,大数据系统中的工作流涉及多部门、多责任人且跨系统的数据,如何才能协调好这些业务系统准时、保质保量地产出数据,避免出现因业务系统宕机/脏数据导致数据延时产出、产出脏数据,关乎到企业数据业务的连续性问题甚至高层的信任问题...

组件参考:所有组件汇总

推荐方法 FM算法 FM(Factorization Machine)算法兼顾特征之间的相互作用,是一种非线性模型,适用于电商、广告及直播的推荐场景。ALS矩阵分解 交替最小二乘ALS(Alternating Least Squares)算法的原理是对稀疏矩阵进行模型分解,评估...

LOAD DATA

注意事项 使用load data进行数据导入时,load data语句并非一个事务,因此各种原因(如数据宕机等)可能导致部分数据插入,剩余部分未插入。客户端需要开启 local-infile。语法 LOAD DATA[LOCAL]INFILE 'file_name'[REPLACE|IGNORE]INTO ...

敏感数据溯源

DataWorks的数据溯源功能,支持通过提取数据泄露文件中数据的水印信息,帮助您定位到可能会泄露目标数据的责任人。本文为您介绍如何创建溯源任务,并通过该任务查找可能会泄露数据的责任人。前提条件 已创建 数据识别规则,详情请参见 配置...

线性回归

线性回归模型具有简单、易于理解和解释的特点,同时可以通过多项式扩展等方法处理非线性数据,具有较高的泛化能力和预测准确率。但是,线性回归模型对于离群点、噪声数据和非线性关系的数据比较敏感,需要进行特征标准化和正则化处理。组件...

接入阿里云ECS自建数据库实例

无法连接:可能是网络不通、实例宕机原因。认证失败:用户名或者密码错误。权限不足:可以正常连接实例,但是权限不足,请查看 权限说明。单击 完成。集中模式接入 登录 DAS控制台。在控制台首页的 热荐功能 区域单击 快速实例接入。单击...

MaxCompute安全白皮书

列级别访问控制 基于标签的安全(LabelSecurity)是项目空间级别的一种强制访问控制策略(Mandatory Access Control,MAC),它的引入可以让项目空间管理员更加灵活地控制用户对列级别敏感数据的访问。LabelSecurity需要将数据和访问数据的...

PolarDB并行查询

串行优化流程中做针对并行执行的补强,例如修正table扫描方式等,这也是上面性能数据中Q6/Q12会有超线性加速比的原因。全算子统计信息推导+代价计算,补充了一系列的cost formula和cardinality estimation推导机制。自适应执行策略 在早期...

概念解释

Validation Loss Validation Loss代表针对验证集学习的拟合程度,曲线一般呈现先下降后上升趋势,Loss越小,表示验证数据拟合程度越高,优秀的模型效果往往出现Validation Loss的最小值节点,此时拟合程度最佳,训练效果最好。Validation ...

接入其他自建或其他云厂商数据库实例

本文介绍如何在数据库自治服务DAS上接入除阿里云外的其他自建数据库,包括用户本地机房数据库、其他云厂商的数据库和其他云厂商虚拟上的自建数据库。前提条件 DAS目前支持接入的自建数据库引擎:MySQL MongoDB PostgreSQL Redis 说明 ...

通用参考:添加路由

如果添加路由后,仍然存在网络连通问题,请根据如下因素进行排查:如果独享资源组访问的是本地IDC数据源,或者跨账号访问数据源,请先参考 配置资源组与网络连通 进行网络连通,再为独享资源组绑定与数据库网络连通的VPC。如果您的数据源已...

文档修订记录

DataWorks数据安全治理路线 2023年12月更新记录 时间 特性 类别 描述 产品文档 2023.12.29 新增功能 数据开发 若您要在DataWorks中进行数据建模、数据开发或使用运维中心周期性调度任务,需先将已创建的数据源或集群绑定至数据开发...

模型训练最佳实践

Training Loss Trianing Loss 代表针对训练数据学习的拟合程度,曲线一般呈现下降趋势,Loss越小,表示训练数据拟合程度越高,过小的Loss易导致数据过拟合,需要根据实际训练过程进行判断 Validation Loss Validation Loss代表针对验证集...

StarRocks概述

集群具有自愈能力,可弹性恢复,节点的宕机、下线和异常都不会影响StarRocks集群服务的整体稳定性。StarRocks采用分布式架构,存储容量和计算能力可近乎线性水平扩展。StarRocks单集群的节点规模可扩展到数百节点,数据规模可达到10 PB级别...

管理问题数据

数据质量支持您保留数据质量监控过程中从数据表中发现的非预期数据,帮助您快速排查、定位问题,提升数据质量。本文为您介绍如何管理数据质量监控过程中从数据表中发现的非预期数据。背景信息 问题数据数据质量支持在部分规则校验不通过...

什么是EMR Serverless StarRocks

实例具有自愈能力,可弹性恢复,节点的宕机、下线和异常都不会影响StarRocks实例服务的整体稳定性。StarRocks采用分布式架构,存储容量和计算能力可近乎线性水平扩展。StarRocks单实例的节点规模可扩展到数百节点,数据规模可达到10 PB级别...

可用性与可靠性

异常时自动切换节点,宕机时自恢复来保证极致的可用性,还可以通过备份恢复来进行数据恢复。主备多副本与云盘三副本 AnalyticDB PostgreSQL版 是基于MPP架构的分布式数据库,对于所有的分布式系统来说,在通过分布式来增强性能的同时,也...

分段多项式回归

参数说明 IN端口 参数名 参数描述 是否必填 输入数据类型 数据源类型 特征变量 配置模型特征列 是 整数或浮点数 说明 若存在数值数据,则会抛出异常。CSV组件。IGateOffline组件。平台上其他数据处理组件。按照平台组件开发的自定义组件...

基本概念

数学规划求解常见的子问题类别还有混合整数规划(Mixed Integer Programing,MIP)、非线性规划(Nonlinear Programing,NLP)等。除此外,当前还有 仿真优化 和 在线优化 类别能力,可联系我们获取。本地运行版 本地运行版,简称本地版,是...

高斯过程回归

功能说明 高斯过程回归是使用高斯过程先验对数据进行回归分析的非参数模型。计算逻辑原理 高斯过程回归中支持三种核函数:高斯核:,其中尺度因子,尺度 是高斯核函数的参数。线性核:,其中偏移 和尺度因子,是线性核函数的参数。二次有理...

什么是数据资源平台

空间计算节点可作为节点任务统一编排到工作流,实现空间数据和空间数据的融合治理及治理链路固化。空间服务:支持将空间数管中的各类型空间数据发布成行业标准的空间服务,支持发布OGC WMTS、WMS、WFS服务;TMS(MVT)矢量瓦片服务;S3M...

IO加速

RDS PostgreSQL开启IO加速功能后,会根据不同实例规格提供一定容量的高速缓存空间,当该空间写满时,会报错 No space left on device,该问题不影响临时数据的相关SQL执行。开启或关闭IO加速功能后,实例约有30秒不可用,建议在业务低峰...

高斯分布拟合

功能说明 高斯拟合分布组件支持对给定数据点进行高斯分布拟合,利用KS检验数据是否服从高斯分布,输出拟合后的概率分布,以及KS检验结果、高斯分布均值、标准差。计算逻辑原理 高斯分布:若随机变量 服从一个位置参数、尺度参数为 的概率...

泊松分布拟合

功能说明 泊松分布拟合组件支持对给定数据点进行泊松分布拟合,利用KS检验数据是否服从泊松分布,输出拟合后的概率分布,以及KS检验结果、泊松分布的期望(方差)。计算逻辑原理 泊松分布:泊松分布的概率密度函数为 泊松分布的参数是 单位...

配置数据识别规则

背景信息 DataWorks支持您按照数据的敏感级别和所属分类定义数据识别规则,帮助您识别组织内的敏感数据,对于识别结果不准确的数据,您可以 手动修正数据,并在 敏感数据概况 模块为您展示最近的通过数据识别规则命中的、按照项目细分的...

卡方分布拟合

功能说明 卡方分布拟合组件支持对给定数据点进行卡方分布拟合,利用KS检验数据是否服从卡方分布,输出拟合后的概率分布,以及KS检验结果、卡方分布自由度。计算逻辑原理 卡方分布:卡方分布是统计推断中应用最广泛的概率分布之一。其定义为...

NULL值相关的函数

返回类型 如果所有出现的 expr 都是数字数据类型或任何可以隐式转换为数字数据类型的非数字数据类型,则数据库将确定具有最高数字优先级的参数,隐式将其余参数转换为该数据类型,并返回该数据类型。示例 SELECT coalesce(null,3.934,1)...

动态特征提取

线性趋势:对采样数据序列进行线性拟合,取线性模型的系数,作为输出。变化趋势:对采样数据序列做Mann-Kendall测试(曼肯德尔检验),若“无趋势”,则输出0;反之,则取slope参数,作为输出。曼肯德尔检验:Mann-Kendall 趋势检验(有时...

产品优势

不支持 MTTR 深度优化,宕机恢复速度是开源HBase的10倍。不支持 多租户 认证与ACL 支持易用的账号密码认证和ACL管理,请参见 用户和ACL权限管理。较复杂 资源隔离 支持RS Group功能,实现租户间的资源物理隔离。不支持 运维诊断 运维工具 ...

滤波

否 0[0,99999999]中值滤波、滑动平均滤波、FIR滤波、最大值滤波、最小值滤波、趋势线拟合滤波:参数名 参数描述 是否必填 参数默认值 参数范围 采样方式 获取滤波数据的方式。按时间:使用过去一段时间的输入数据。按次数:使用过去若干次...

平台安全诊断

数据存储备份 说明 系统会自动备份MaxCompute数据的历史版本并保留一定时间,您可以对保留周期内的数据进行快速恢复,避免因误操作丢失数据。详情请参见:《MaxCompute备份与恢复》MaxCompute项目 MaxCompute工作空间默认拥有该功能,您...

pg_dump

o 即-oids 备份对象标识符(OID)作为每个表数据的一部分。如果您的应用程序以某种方式引用OID列(例如在一个外键约束中引用OID列),请使用此选项。否则,不使用此选项。O 即-no-owner 匹配原始数据库时,不需要设置对象的所有权。说明 此...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 云虚拟主机 运维安全中心(堡垒机) 短信服务 DataV数据可视化 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用