文档修订记录

QueryPublicModelEngine 2023.10.20 新增功能 上传与下载 DataWorks的上传与下载模块,提供了便捷的数据上传功能,支持将多种来源(例如,本地文件、OSS文件)的数据上传至MaxCompute大数据引擎中进行分析处理及相关管理操作,致力于为您...

常见问题

迁移与同步 为什么OSS外表导入ORC、PARQUET等格式的数据,出现内存报错或OOM挂掉?如何处理导入数据报错:too many parts?为什么DataX导入速度慢?为什么Hive导入后其数据行数跟ClickHouse对不上?为什么Kafka导入后其数据行数跟...

数据集市

数据集市是基于业务分类,面向特定应用场景或者产品的数据组织。通常位于数据应用层,依赖于公共层的整合数据。本文为您介绍如何创建数据集市并管理主题域。前提条件 已创建业务分类,用于对指定业务进行特定场景化的细分。详情请参见 业务...

Trino概述

支持丰富的数据源:Hive Cassandra Kafka MongoDB MySQL PostgreSQL SQL Server Redis Redshift 本地文件 支持高级数据结构,具体如下:数组和Map数据 JSON数据 GIS数据 颜色数据 功能扩展能力强,提供了多种扩展机制:扩展数据连接器 ...

Presto概述

支持丰富的数据源,例如,Hive、Hudi、Iceberg、Delta Lake、MySQL和PostgreSQL。支持高级数据结构,具体如下:数组和Map数据 JSON数据 GIS(Geographic Information System)数据 颜色数据 功能扩展能力强,提供了多种扩展机制:扩展数据...

SQL结果集导出

该实例下的数据库包含您待导出的数据。录入实例的具体操作,请参见 云数据库录入、他云/自建数据库录入。注意事项 SQL结果集导出功能在免费导出数据的行数、单次导出表容量等方面受限于管控模式。更多信息,请参见 各管控模式支持的功能。...

基本概念

副本(Replica)为了在异常情况下保证数据的安全性和服务的高可用性,云数据库ClickHouse 提供了副本机制,将单台服务器的数据冗余存储在2台或多台服务器上。数据库(Database)数据库是 云数据库ClickHouse 集群中的最高级别对象,内部...

阶段一:基础防护建设

管理员可以根据上述敏感数据类型及本企业的数据属性,定义本企业/组织的数据敏感级别,一般情况下可以参考如下分级方式。数据属性 分级 政府机构 绝密(Top Secret):对国家安全造成异常严重损害。秘密(Secret):对国家安全造成严重损害...

通过数据同步功能同步Kafka至湖仓版(推荐)

注意事项 Kafka中创建的Topic数据超过一定的时间会被自动清理,如果Topic数据过期,同时数据同步任务失败,重新启动同步任务时读取不到被清理掉的数据,会有丢失数据的风险。因此请适当调大Topic数据的生命周期,并在数据同步任务失败时...

数据水印

影响行数(必选)预估本次导出会影响的数据行数,您可以在SQLConsole中使用 count 命令进行统计。说明 在预检查阶段,系统将会显示实际影响行数,您可以再次校验是否符合预期,及时发现异常,避免发生数据安全事故。跳过校验(可选)是否跳...

新建注册上指标

您可以将物理表中的指标字段上至汇总逻辑表进行数据分析。...参数 描述 数据类型 选择上指标的数据类型。度量单位 选择上指标的度量单位。业务负责人 选择上指标的业务负责人。描述 填写对上指标的简单描述。配置完成后单击 确定。

新建注册上指标

您可以将物理表中的指标字段上至汇总逻辑表进行数据分析。...参数 描述 数据类型 选择上指标的数据类型。度量单位 选择上指标的度量单位。业务负责人 选择上指标的业务负责人。描述 填写对上指标的简单描述。配置完成后单击 确定。

数据格式

为了支持增全量存储和处理一体化架构,Transaction Table2.0(简称TT2)设计了统一的表数据组织格式,既可支持MaxCompute普通表的所有功能,同时也能很好的支持增量处理链路的新场景,包括time travel查询、upsert操作等。本文为您介绍...

如何处理Tair集群数据倾斜

下图介绍两个典型的数据倾斜场景,如下图所示,虽然Key均匀地分布在集群中,每个数据分片节点2个Key,但仍产生了数据倾斜:Replica 1 节点中 key1 的QPS明显高于其他Key,属于典型 数据访问倾斜,会导致该Key所在的数据分片节点CPU使用率...

如何处理Redis集群数据倾斜

下图介绍两个典型的数据倾斜场景,如下图所示,虽然Key均匀地分布在集群中,每个数据分片节点2个Key,但仍产生了数据倾斜:Replica 1 节点中 key1 的QPS明显高于其他Key,属于典型 数据访问倾斜,会导致该Key所在的数据分片节点CPU使用率...

概述

这意味着它是用于管理存储在关系中的数据的系统。关系实质上是用于表的数学术语。将数据存储在表中的概念现今是如此常见,以致于似乎本来就很明显,但存在许多其他组织数据库的方式。Unix 类操作系统上的文件和目录构成层次数据库的示例。...

敏感数据溯源

背景信息 通过DataWorks 数据保护伞 数据脱敏管理,开启目标 数据识别规则 数据水印 功能后,则在DataWorks中,对命中该规则的数据所执行的所有操作(例如查询、下载等)均会自动生成水印信息。水印信息用于记录用户的访问行为,...

名词解释

TABLE 〇 〇 Table(表)是一种结构化的数据对象,用于存储和组织相关的数据记录。构建表时需要定义表的Schema结构,包括表的列名和列类型。在宽表引擎中创建的表称为 宽表,在时序引擎中创建的表称为 时序表。PRIMARY KEY 〇 〇 Primary ...

配置管理

提交数据变更时的原因分类。示例以及详情请参见 附录:数据变更原因分类。数据变更的执行方式 取值:COMMITOR:表示审批通过后由提交者执行。AUTO:表示审批通过后自动执行。LAST_AUDITOR:表示由最后一个审批人执行。审批流的审批节点是否...

2023年

SQL处理优化 2023-06-26 新增数据组织优化 新说明 本文为您介绍Transactional Table 2.0在数据组织优化服务上的架构设计。数据组织优化 2023-06-26 新增TimeTravel查询与Incremental查询 新说明 对于Transaction Table2.0类型的表,...

数据倾斜诊断

您也可以添加过滤条件,查看指定Schema或指定表的数据倾斜情况,查询语句如下:查看指定Schema下所有表的数据倾斜情况:SELECT*FROM adbpg_toolkit.diag_skew_tables WHERE schema_name='名称>';查看指定表的数据倾斜情况:SELECT*FROM ...

导入数据

原因类别 根据实际情况选择数据导入的原因。业务背景 详细填写本次操作的业务背景,减少沟通成本。执行方式 根据需求,选择工单执行方式:审批通过后,提交者执行。审批通过后,自动执行。最后一个审批人执行。文件编码 选择数据库的文件...

DataHub数据

datahub侧对于一次request请求写入的数据条数限制是10000条,超出10000条数据会超出限制导致任务出错,请根据您单条数据平均数据量*10000条数据的数据总量来从侧方面进行单次写入datahub的数据条数控制。比如每条数据10 k,那么此参数的...

索引优化

因此,根据索引的字段组织合适的数据物理分布可以有效地提高索引的性能。您可以使用排序键结合组合排序和多维排序改善数据的物理分布。同时对于行存表如果建立的是B-Tree类型的索引,可以考虑使用Cluster进行物理排序。大数据集场景下优先...

普通数据变更

数据管理DMS的普通数据变更功能支持INSERT、UPDATE、DELETE、TRUNCATE、CREATE TABLE等SQL语句,可以对数据库中的数据进行变更操作,用于数据初始化、历史数据清理、问题修复、功能测试等场景。本文介绍在DMS中进行普通数据变更的方法。...

快速入门

参数 描述 Project 项目(Project)是DataHub数据的基本组织单元,下面包含多个Topic。值得注意的是,DataHub的项目空间与MaxCompute的项目空间是相互独立的。用户在MaxCompute中创建的项目不能复用于DataHub,需要独立创建。描述 Project的...

JindoCube使用说明

JindoCube在E-MapReduce 3.24.0及之后版本...可能导致Cache数据不完整的情况包括:用户在Cache详情页主动删除查询需要的Cache Partition数据,构建、更新Cache时指定的过滤条件过滤了查询需要的数据,查询需要的数据还未及时更新到Cache等。

授权和回收数据板块权限

授权原因 填写授予数据板块权限的原因。单击 确定,完成数据板块权限的授权。回收数据板块权限 按照下图操作指引,进入 数据板块回收 对话框。在 数据板块回收 对话框,配置参数。参数 描述 回收用户 选择需要回收数据板块权限的用户。逻辑...

授权和回收数据板块权限

授权原因 填写授予数据板块权限的原因。单击 确定,完成数据板块权限的授权。回收数据板块权限 按照下图操作指引,进入 数据板块回收 对话框。在 数据板块回收 对话框,配置参数。参数 描述 回收用户 选择需要回收数据板块权限的用户。逻辑...

使用DTS进行数据迁移是否会覆盖已存在数据

概述 本文介绍使用DTS进行数据迁移是否会覆盖已存在数据。详细信息 如果配置迁移任务时,只迁移几个表,那么预检查...因此在目标库有数据的情况下,DTS不支持进行数据迁移,所以DTS数据迁移不会覆盖已存在的数据。适用于 数据传输服务 DTS

数据集成侧同步任务配置

同步任务支持的数据源及其配置详情请参见 支持的数据源与读写能力。说明 数据源相关能力介绍详情请参见:数据源概述。已完成数据源环境准备。您可以基于您需要进行的同步配置,在同步任务执行前,授予数据源配置的账号在数据库进行相应操作...

开发前准备:绑定数据源或集群

若您要在DataWorks中进行数据建模、数据开发或使用运维中心周期性调度任务,需先将已创建的数据源或集群绑定至数据开发(DataStudio)模块。绑定后,才可读取数据源或集群中的数据,并进行相关开发操作。前提条件 您需根据后续要开发和调度...

授权与回收数据源权限

③ 列表区 为您展示授权的数据源账号、权限类型、有效期至、权限来源信息,同时,您可以在 操作 列下对数据源进行 回收 操作。回收:回收单个账号的整体数据源权限。在 数据源回收 对话框,填写 回收原因。单击 确定。④ 批量操作区 回收:...

授权与回收数据源权限

③ 列表区 为您展示授权的数据源账号、权限类型、有效期至、权限来源信息,同时,您可以在 操作 列下对数据源进行 回收 操作。回收:回收单个账号的整体数据源权限。在 数据源回收 对话框,填写 回收原因。单击 确定。④ 批量操作区 回收:...

数据库对象的逻辑结构

AnalyticDB PostgreSQL 将数据组织为表的形式,并且提供索引、视图以及序列等功能,详细使用方法,请参见 PostgreSQL官方文档。模式 一个数据库包含一个或多个已命名的模式(Schema),模式又包含表以及其他对象,包括数据类型、函数、操作...

管理Dataphin数据源权限

如果需要查看字段的数据,则选择 查询权限。权限账号 系统默认选择为 应用。权限账号所属项目 系统默认选择为默认项目。应用 选择应用的分组及应用。有效期至 选择权限的截至时间。您也可以选择自定义后,指定截至时间。申请原因 填写申请...

什么是EMR Serverless StarRocks

数据湖分析 StarRocks不仅能高效的分析本地存储的数据,也可以作为计算引擎直接分析数据湖中的数据,支持Apache Hive、Apache Iceberg、Apache Hudi等数据组织结构;支持Parquet、ORC、CSV等文件格式;也支持HDFS、S3、OSS等存储方式。在...

数据安全治理的必要性

数据安全治理采用体系化的方式保障数据安全,要求妥善处理各类人员对组织资产的行为,以避免发生数据安全事件。数据安全治理的目标是协助企业树立数据安全相关的法律意识,确保企业经营合法合规,同时展现企业的社会责任,保护企业的核心...

概述

数据组织 ZooKeeper的数据组织方式与标准文件系统类似,组织成类似文件树的结构,在ZooKeeper中使用znode(ZooKeeper node)来描述文件,与标准文件系统不同的是,znode并不区分目录或者文件的概念,每个znode都可以存储数据。ZooKeeper...

配置任务常见错误码及排查方法

DTS.Msg.InvalidIpAddress 配置 接入方式 为 公网IP、专线/VPN网关/智能网关 或 云企业网CEN 的数据库实例的DTS任务时。原因:输入的IP地址格式错误,导致无法解析。解决方法:输入正确的IP地址后重试。DTS.Msg.PauseDenied....
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 数据库备份 DBS 云数据库 RDS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用