数据集成

离线同步任务 场景介绍 离线数据同步支持 源端单表同步至目标端单表、源端分库分表同步至目标端单表 两类同步场景。同时,结合DataWorks调度参数,可实现增量数据和全量数据周期性写入目标表的对应分区;再配合运维中心的补数据功能,可...

数据同步简介

基本原理 类似于 MySQL 的 binlog 机制,数据同步服务器和客户端 SDK 之间传递的基本数据单元为 oplog,当业务需要同步一个变更数据到指定的用户或设备时,业务调用数据同步接口,数据同步服务端会将业务需要同步的数据变更包装为一个 ...

离线同步能力说明

数据同步场景 离线同步支持单表同步至目标端单表、分库分表同步至目标端单表两类同步场景。同时,结合DataWorks调度参数,实现增量数据和全量数据周期性写入到目标表对应分区功能。离线同步任务使用调度参数,再结合 运维中心 补数据 功能...

数据集成侧同步任务能力说明

DataWorks为您提供多种数据源之间进行不同数据同步场景的全增量同步任务,包括实时数据同步、离线全量同步、离线增量同步等同步场景,助力企业数据更高效、更便捷的一键上云。背景信息 实际业务场景下,数据同步通常不能通过一个或多个简单...

Amazon Redshift数据

Amazon Redshift数据源为您提供读取和写入Amazon Redshift的双向通道,方便您后续可以通过向导模式和脚本模式配置数据同步任务。本文为您介绍Amazon Redshift数据同步能力支持情况。支持的Amazon Redshift版本 Amazon Redshift使用的驱动...

LTS(原BDS)服务介绍

可以通过LTS将RDS数据实时同步到Lindorm宽实现冷热数据分离,Lindorm宽提供自动水平扩展、高并发查询、多维索引、轻量分析,Lindorm Streams提供变更数据有序订阅,LTS还支持将Lindorm 宽表数据同步到其它分析系统进行复杂数据分析。

同步时源库为PostgreSQL的注意事项及限制

如果同步的源数据库类型为PostgreSQL,如RDS PostgreSQL、自建PostgreSQL,您需要在配置具体的同步任务前,参考本文的注意事项及限制,以保障数据同步任务的正常运行。源库为PostgreSQL的同步方案概览 根据同步方案,查看同步任务的注意...

DRDS(PolarDB-X)数据

DRDS(PolarDB-X)数据源为您提供读取和写入DRDS(PolarDB-X)双向通道的功能,本文为您介绍DataWorks的DRDS(PolarDB-X)数据同步的能力支持情况。支持的版本 实时读取 支持DRDS(PolarDB-X 1.0)和PolarDB-X 2.0的非只读实例。创建DRDS...

采集数据

user_info_d)及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d为例,为您介绍如何通过DataWorks数据集成实现异构数据源间的数据同步,完成数仓数据...

采集数据

user_info_d)及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d为例,为您介绍如何通过DataWorks数据集成实现异构数据源间的数据同步,完成数仓数据...

一站式HTAP服务

oid: OID relschema:所属 schema 的名称 relname:名 relkind:类型 dist_policy/dist_cols:在 OLAP 引擎上的分布模式和分布列 sync_status:数据的同步状态 sync_start_time:表数据同步的开始时间 sync_end_time:表数据...

数据表

数据同步 配置将上游输出的数据同步到的目标数据表。计算资源类型 选择需要同步到的目标数据源的类型,目前支持的目标数据源类型参见 适用场景 目标数据源 选择同步到的目标数据源。目标数据表 选择同步到的目标数据源中的表名。生命周期...

迁移工具

将MySQL数据同步迁移到表格存储 将HBase数据同步到表格存储 将MaxCompute数据同步到表格存储 将表格存储数据同步到MaxCompute 将表格存储数据同步迁移到OSS 将表格存储数据表数据同步到另一个数据表 将表格存储时序表中数据同步到另一个...

全量数据同步

通过选择已注册的数据源端数据和目标端,实现全量任务自动建的方式创建离线同步周期任务,本文介绍如何创建MySQL to MaxCompute离线全量数据同步一次性调度的任务。前提条件 已新建工作组,具体操作,请参见 新建工作组。已在工作组中...

配置ClickHouse输出组件

批量插入字节大小、批量条数 批量插入字节大小 和 批量条数 均为数据同步的性能参数,用于调试数据同步的速度。批量插入字节大小:数据同步过程中每一次写入数据的字节数据量,默认字节大小为67108864,也就是64MB。批量条数:数据同步过程...

新增多实时任务

数据同步支持实时任务新增多任务,并支持一键启动多个上云任务,实现全量任务自动建。本文介绍如何新增多实时任务。前提条件 已新建Oracle和DataHub数据源,请参见 新建数据源。说明 当前仅支持Oracle LogMiner(11G)到DataHub多...

新增多实时任务

数据同步支持实时任务新增多任务,并支持一键启动多个上云任务,实现全量任务自动建。本文介绍如何新增多实时任务。前提条件 已新建Oracle和DataHub数据源,请参见 新建数据源。说明 当前仅支持Oracle LogMiner(11G)到DataHub多...

配置ClickHouse输出组件

批量插入字节大小、批量条数 批量插入字节大小 和 批量条数 均为数据同步的性能参数,用于调试数据同步的速度。批量插入字节大小:数据同步过程中每一次写入数据的字节数据量,默认字节大小为67108864,也就是64MB。批量条数:数据同步过程...

数据集成概述

背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量数据表的同步任务、能够集成多种异构数据源、能够实现对数据源的数据进行轻度预处理、能够实现数据同步任务的调优(例如容错,限速,并发)等。...

增量数据同步

通过选择已注册的数据源端数据和目标端,实现增量任务自动建的方式创建离线同步周期任务,本文介绍如何创建MySQL to MaxCompute离线增量数据同步周期调度的任务。前提条件 已新建工作组“信息中心(xxzx)”,具体操作,请参见 新建工作...

部署高可用架构应用集群

由于数据同步操作复杂,本文示例场景中不对多台应用服务器数据同步做要求。当您在部署实际业务时,建议自行通过Syncthing文件同步工具或者Rsync与Inotify组合方式,同步多台服务器之间的数据。步骤一:创建并配置数据库服务器C 本示例中...

配置同步任务中的数据来源和去向

切分键 选择SQLServer数据表中的主键作为切分键。数据去向(Writer)配置信息:配置项 说明 数据源 选择ADS,系统将自动关联 配置AnalyticDB MySQL 2.0数据源 时设置的数据源名称。表 选择分析型数据库MySQL版中的一张表,将SQLServer中的...

配置AnalyticDB for PostgreSQL输出组件

具体操作,请参见 创建AnalyticDB for PostgreSQL数据源 表 选择AnalyticDB for PostgreSQL数据源中的数据表数据同步的目标表。如果AnalyticDB for PostgreSQL数据源中还没有数据表,您也可以执行如下步骤,简单快速的生成目标表:单击 ...

配置Teradata输入组件

同步Teradata数据源的数据至其他数据源的场景中,您需要先配置Teradata输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置Teradata输入组件。使用限制 不支持读取Teradata数据库的视图。前提条件 在开始执行...

配置OceanBase输入组件

同步OceanBase数据源的数据至其他数据源的场景中,您需要先配置OceanBase输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置OceanBase输入组件。前提条件 在开始执行操作前,请确认您已完成以下操作:已创建...

配置OceanBase输入组件

同步OceanBase数据源的数据至其他数据源的场景中,您需要先配置OceanBase输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置OceanBase输入组件。前提条件 在开始执行操作前,请确认您已完成以下操作:已创建...

配置Teradata输入组件

同步Teradata数据源的数据至其他数据源的场景中,您需要先配置Teradata输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置Teradata输入组件。前提条件 已创建Teradata数据源,如何创建,请参见 创建Teradata...

配置IBM DB2输入组件

同步IBM DB2数据源的数据至其他数据源的场景中,您需要先配置IBM DB2输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置IBM DB2输入组件。前提条件 在开始执行操作前,请确认您已完成以下操作:已创建IBM DB2...

配置IBM DB2输入组件

同步IBM DB2数据源的数据至其他数据源的场景中,您需要先配置IBM DB2输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置IBM DB2输入组件。前提条件 在开始执行操作前,请确认您已完成以下操作:已创建IBM DB2...

配置Vertica输入组件

同步Vertica数据源的数据至其他数据源的场景中,您需要先配置Vertica输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置Vertica输入组件。在开始执行操作前,请确认您已完成以下操作:已创建Vertica数据源。...

配置Vertica输入组件

同步Vertica数据源的数据至其他数据源的场景中,您需要先配置Vertica输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置Vertica输入组件。在开始执行操作前,请确认您已完成以下操作:已创建Vertica数据源。...

逻辑和字段资产详情

影响 分为 数据表影响 和 集成同步影响,为您展示引用了当前表的直接下游表,引用了直接下游表的间接下游表以及对应的集成同步任务,最多15层。支持 导出数据 查看。勾选 仅展示直接下游表 后,默认展示当前表直接影响的下游表,取消勾选将...

逻辑和字段资产详情

影响 分为 数据表影响 和 集成同步影响,为您展示引用了当前表的直接下游表,引用了直接下游表的间接下游表以及对应的集成同步任务,最多15层。支持 导出数据 查看。勾选 仅展示直接下游表 后,默认展示当前表直接影响的下游表,取消勾选将...

配置MaxCompute输出组件

如果Hive数据源中没有数据同步的目标,则您可以通过 一键生成目标 的功能,简单快速的生成目标。详细的操作步骤如下:单击 一键生成目标。Dataphin会自动为您匹配创建目标的代码,包括目标名称(默认为来源名)、字段类型...

配置MaxCompute输出组件

如果Hive数据源中没有数据同步的目标,则您可以通过 一键生成目标 的功能,简单快速的生成目标。详细的操作步骤如下:单击 一键生成目标。Dataphin会自动为您匹配创建目标的代码,包括目标名称(默认为来源名)、字段类型...

配置TDH Inceptor输出组件

使用限制 TDH Inceptor输出组件支持写入文件格式为orc、parquet、text的TDH Inceptor数据表。不支持ORC格式的事务表集成。前提条件 已创建TDH Inceptor数据源。具体操作,请参见 创建TDH Inceptor数据源。进行TDH Inceptor输出组件属性配置...

配置AnalyticDB for PostgreSQL输出组件

表 选择AnalyticDB for PostgreSQL数据源中的数据表数据同步的目标表。如果AnalyticDB for PostgreSQL数据源中还没有数据表,您也可以执行如下步骤,简单快速的生成目标表:单击 一键生成目标表。Dataphin会自动为您匹配创建表的代码,...

配置Hive输出组件

使用限制 Hive输出组件支持写入文件格式为 orc、parquet、text、iceberg(iceberg格式仅支持E-MapReduce5.x的Hive计算源或数据源)的Hive数据表。不支持ORC格式的事务表、Kudu表集成。说明 Kudu表数据集成请使用Impala输出组件。更多信息,...

配置SAP HANA输入组件

同步SAP HANA数据源的数据至其他数据源的场景中,您需要先配置SAP HANA输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置SAP HANA输入组件。前提条件 在开始执行操作前,请确认您已完成以下操作:已创建SAP HANA...

配置SAP HANA输入组件

同步SAP HANA数据源的数据至其他数据源的场景中,您需要先配置SAP HANA输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置SAP HANA输入组件。操作步骤 请参见 通过离线单条管道配置集成任务,进入离线管道脚本的开发...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云服务器 ECS 数据传输服务 云数据库 RDS 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用