基本概念

数据资产:数据资源平台中存在大量的数据表、标签、API等各类数据资产,数据管理者通过数据汇聚、数据治理、数据分析后,需要对整个平台数据进行统一管控,了解平台的核心数据资产,提供对应的数据资产管理规范。统一服务 应用:是调用API...

OGG插件介绍

pid_before|pid_after|num_before|num_after|+-+-+-+-+-+-+-+-+-+|14810373343020000|I|2016-12-06 15:15:28.000141|NULL|1|NULL|2|NULL|1|修改这条数据,比如把num改为20,datahub则会收到的一条变更数据记录,如下:+-+-+-+-+-+-+-+-+-+|...

数据质量教程概述

数据的缺失包括数据记录的缺失(表行数异常)和记录中某字段信息的缺失(字段出现空值)。在本教程中,您需要重点关注数据的生产环节(MaxCompute外部表引用的表格存储数据)和加工环节(数据仓库CDM及ADS层)中表行数是否大于0、表行数...

数据质量教程概述

数据的缺失包括数据记录的缺失(表行数异常)和记录中某字段信息的缺失(字段出现空值)。在本教程中,您需要重点关注数据的生产环节(MaxCompute外部表引用的表格存储数据)和加工环节(数据仓库CDM及ADS层)中表行数是否大于0、表行数...

实时同步字段格式

对于INSERT、UPDATE和DELETE等不同的操作类型,增量数据记录中的_before_image_和_after_image_定义如下:当操作类型为INSERT时,生成的记录为更新后的记录,_before_image_取值为N,_after_image_取值为Y。当操作类型为UPDATE时,数据集成...

数据迁移链路规格说明

说明 如果一条SQL语句中包含对多行数据的操作,则计为多条数据记录变化;对同一条记录反复增删改则计为多条数据记录变化。每次COMMIT操作也会被计为一次数据记录变化的次数。数据迁移规格说明 数据迁移根据迁移链路的迁移性能上限,定义了...

Vector

TVS.SCAN TVS.SCAN index_name cursor[MATCH pattern][COUNT count][FILTER filter_string][VECTOR vector][MAX_DIST max_distance]在指定向量索引中,扫描符合条件的数据记录(key)。TVS.HINCRBY TVS.HINCRBY index_name key attribute_...

如何设计时序数据

以下图的空气检测数据为例:每个时间点对应的数据记录可以详细分为几个部分:表(Table):代表一系列同类时序数据的集合。标签(Tags):表明指标项监测针对的具体对象属性。其中一个标签(Tag)由一个标签键(Key)和一个对应的标签值...

从SLS同步

说明 具体的脏数据记录,您可以单击投递任务 操作 列的 监控 查看。单击 确定。成功配置SLS数据投递后,您可以在 日志投递 页面查看投递任务。任务状态从 待同步 变更为 同步中 后,即成功开启SLS日志投递。说明 您可以对投递任务进行 监控...

名词解释

TABLE 〇 〇 Table(表)是一种结构化的数据对象,用于存储和组织相关的数据记录。构建表时需要定义表的Schema结构,包括表的列名和列类型。在宽表引擎中创建的表称为 宽表,在时序引擎中创建的表称为 时序表。PRIMARY KEY 〇 〇 Primary ...

GetOpSensitiveData

}],"totalCount":6 返回的敏感数据记录信息。包括totalCount(敏感数据总条数)和opRiskDatas(风险数据列表)。其中opRiskDatas(风险数据列表)包括:sensType:敏感类型。sensLevel:敏感级别(数字越大表示敏感程度越高)。opType:...

TABLESAMPLE采样

TABLESAMPLE(<n>PERCENT)其中 n 为采样百分比,取其中 n%的数据,即采样返回的数据记录个数和源表中总记录个数之比大概是 n%,非精确值。随机返回指定记录数采样。TABLESAMPLE(<m>ROWS)其中 m 为指定随机返回的记录数。如果源表中的总记录...

TABLESAMPLE采样

TABLESAMPLE(<n>PERCENT)其中 n 为采样百分比,取其中 n%的数据,即采样返回的数据记录个数和源表中总记录个数之比大概是 n%,非精确值。随机返回指定记录数采样。TABLESAMPLE(<m>ROWS)其中 m 为指定随机返回的记录数。如果源表中的总记录...

技术面临的挑战与革新

因为数据库系统需要处理大量的并发事务,为了保证并发事务能够尽可能高效的并发执行而又互不干扰,发展出若干种技术,比如多版本并发处理(MVCC),乐观并发处理(OCC),这些技术的关键在于多个事务同时读写相同的数据记录时,如何调度事务的...

创建导出任务

标签映射 为导出的数据记录设置TSDB标签,第一个框填写标签名称,第二个框填写标签值,该配置项的标签名与标签值均支持表达式替换。投递时间 从什么时间开始数据投递(小于该时间范围的数据不会被投递)。说明 度量(metric)不存在时会...

概述

日志备份:也叫增量备份,备份了记录数据变更的Binlog日志。开启日志备份后,基于“数据备份+日志备份”,您可以恢复时间范围内任意时间点(精确至秒)的数据。例如,实例中创建了2021年01月01日00:00:01的数据备份集以及该时间之后的日志...

DTS_BINLOG_PARSER

UPDATE和INIT|recordTimestamp timestamp,-记录的时间戳|extraTags string,-记录的属性信息,例如pk,uk等|fields string,-数据表的schema信息|beforeImages string,-本记录生成前的记录数据|afterImages string-本记录生成后的记录数据 ...

同步 OceanBase 数据库 MySQL 租户的数据至 Analytic...

目标端表对象存在记录时处理策略 选择 忽略:目标端表对象存在数据时,如果原数据与写入数据冲突,数据传输采用将冲突数据记录日志,保留原数据不变的策略进行数据写入。重要 选择 忽略,全量校验将使用 IN 模式拉取数据,无法校验目标端多...

使用数据传输迁移数据

目标端表对象存在记录时处理策略 处理策略包括 忽略 和 停止迁移:选择 忽略:当目标端表对象存在数据时,如果原数据与写入数据冲突,数据传输采用将冲突数据记录日志,保留原数据不变的策略进行数据写入。重要 选择 忽略,全量校验将使用 ...

InnoDB Physiological Logging

物理日志(Physical logging)物理日志是指在日志中保存一个页中发生改变的字节,是纯物理格式的日志,逐字节的记录数据的改动。比如[start,end,'xxxx']格式的内容改动。优点 高效率,并且可以直接修改物理格式,任何操作都不需要重新遍历...

迁移 PolarDB-X 1.0 数据库的数据至 OceanBase 数据库...

目标端表对象存在记录时处理策略 处理策略包括 忽略 和 停止迁移:选择 忽略:当目标端表对象存在数据时,如果原数据与写入数据冲突,数据传输采用将冲突数据记录日志,保留原数据不变的策略进行数据写入。重要 选择 忽略,全量校验将使用 ...

Tablestore Stream数据

Tablestore会根据每种操作生成对应的增量数据记录,Reader插件会读出这些记录,并导出为数据集成的数据格式。同时,由于Tablestore具有动态列、多版本的特性,所以Reader插件导出的一行不对应Tablestore中的一行,而是对应Tablestore中的一...

迁移 TiDB 数据库的数据至 OceanBase 数据库 MySQL ...

目标端表对象存在记录时处理策略 处理策略包括 忽略 和 停止迁移:选择 忽略:当目标端表对象存在数据时,如果原数据与写入数据冲突,数据传输采用将冲突数据记录日志,保留原数据不变的策略进行数据写入。重要 选择 忽略,全量校验将使用 ...

迁移 OceanBase 数据库 MySQL 租户的数据至 MySQL ...

目标端表对象存在记录时处理策略 处理策略包括 忽略 和 停止迁移:选择 忽略:当目标端表对象存在数据时,如果原数据与写入数据冲突,数据传输采用将冲突数据记录日志,保留原数据不变的策略进行数据写入。重要 选择 忽略,全量校验将使用 ...

迁移 MySQL 数据库的数据至 OceanBase 数据库 MySQL ...

目标端表对象存在记录时处理策略 处理策略包括 忽略 和 停止迁移:选择 忽略:当目标端表对象存在数据时,如果原数据与写入数据冲突,数据传输采用将冲突数据记录日志,保留原数据不变的策略进行数据写入。重要 选择 忽略,全量校验将使用 ...

迁移 PolarDB-X 2.0 数据库的数据至 OceanBase 数据库...

目标端表对象存在记录时处理策略 处理策略包括 忽略 和 停止迁移:选择 忽略:当目标端表对象存在数据时,如果原数据与写入数据冲突,数据传输采用将冲突数据记录日志,保留原数据不变的策略进行数据写入。重要 选择 忽略,全量校验将使用 ...

迁移 RDS PostgreSQL 实例的数据至 OceanBase 数据库 ...

目标端表对象存在记录时处理策略 选择 忽略:当目标端表对象存在数据时,如果原数据与写入数据冲突,数据传输采用将冲突数据记录日志,保留原数据不变的策略进行数据写入。重要 选择 忽略,全量校验将使用 IN 模式拉取数据,无法校验目标端...

OceanBase 数据库之间的数据迁移

处理策略包括 忽略 和 停止迁移:选择 忽略:当目标端表对象存在数据时,如果原数据与写入数据冲突,数据传输采用将冲突数据记录日志,保留原数据不变的策略进行数据写入。重要 选择 忽略,全量校验将使用 IN 模式拉取数据,无法校验目标端...

数据质量保障原则

完整性 完整性是指数据记录和信息是否完整,是否存在数据缺失情况。数据缺失主要包括记录的缺失和具体某个字段信息的缺失,两者都会造成统计结果不准确。完整性是数据质量最基础的保障。例如,某个稳定业务的数据量每天约为100万条记录,...

迁移 OceanBase 数据库 Oracle 租户的数据至 Oracle ...

目标端表对象存在记录时处理策略 处理策略包括 忽略 和 停止迁移:选择 忽略:当目标端表对象存在数据时,如果原数据与写入数据冲突,数据传输采用将冲突数据记录日志,保留原数据不变的策略进行数据写入。重要 选择 忽略,全量校验将使用 ...

迁移 Oracle 数据库的数据至 OceanBase 数据库 Oracle...

本文为您介绍如何使用数据传输迁移 Oracle 数据库的数据至 OceanBase 数据库 Oracle 租户。重要 如果数据迁移项目长期处于非活跃状态(项目状态为 失败、已暂停 或 已完成),受增量日志保留时长等影响,项目可能无法恢复。数据传输将主动...

数据组织优化

解决方案 Clustering服务主要由MaxCompute内部的Storage Service来负责执行,专门解决小文件合并的问题,但它并不会改变任何数据的历史中间状态,即不会消除任何一条记录数据的中间历史状态。Clustering服务流程 Clustering服务的整体操作...

建立性能基准

测试项 测试值 数据同步时间 无 占用存储大小 无 查询执行时间 无 查询费用预估 无 记录数据同步时间 在您执行数据同步任务后,可以在 运维中心>周期实例 页面右键查看用户任务运行时间,如下图所示。记录占用存储大小 登录 DataWorks控制...

建立性能基准

测试项 测试值 数据同步时间 无 占用存储大小 无 查询执行时间 无 查询费用预估 无 记录数据同步时间 在您执行数据同步任务后,可以在 运维中心>周期实例 页面右键查看用户任务运行时间,如下图所示。记录占用存储大小 登录 DataWorks控制...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

Kafka数据

offset Long timestamp Long headers String partition Long 离线写数据 DataWorks将数据写入Kafka时,支持写入JSON格式或text格式的数据,不同的数据同步方案往Kafka数据源中写入数据时,对数据的处理策略不一致,详情如下。重要 写入text...

文档更新动态(2023年)

更新说明 创建MySQL数据源 创建PolarDB-X数据源 创建AnalyticDB for MySQL 2.0数据源 创建AnalyticDB for PostgreSQL数据源 创建达梦(DM)数据源 创建TiDB数据源 创建Kafka数据源 离线集成配置优化 新增Apache Doris数据源的离线集成。...

X-Engine最佳实践

淘宝和天猫交易订单信息库 淘宝和天猫存储用户交易数据数据库,需要保存用户所有的历史交易记录以供查询,当前交易记录数据库集群现状如下:数据条目超过万亿级,磁盘容量达到PB级。在大促时面临极大的写入压力。虽然可以通过水平拆库,...

SQL洞察和审计

开启该功能后会自动记录来自数据库内核的SQL语句,以及SQL语句的执行账号、IP地址、执行详情等信息,对实例性能没有影响。前提条件 RDS MySQL实例为高可用系列或集群系列。如果是RAM用户,使用 搜索 功能时,需要为RAM用户授予 ...

功能更新动态(2023年)

创建MySQL数据源 创建PolarDB-X数据源 创建AnalyticDB for MySQL 2.0数据源 创建AnalyticDB for PostgreSQL数据源 创建达梦(DM)数据源 创建TiDB数据源 创建Kafka数据源 离线集成 新增Apache Doris数据源的离线集成。整库迁移任务支持...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库审计 云数据库 RDS 数据库备份 DBS 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用