单表实时同步能力说明
DataWorks为您提供的实时数据同步功能,方便您使用单表或整库同步方式,将源端数据库中部分或全部表的数据变化实时同步至目标数据库中,实现目标库实时保持和源库的数据对应。
核心能力
实时同步支持的能力如下图所示:
能力 | 描述 |
多种数据源间的数据同步 | 实时同步支持多种数据源,您可以将多种输入及输出数据源搭配组成同步链路进行数据同步。详情请参见支持的数据源及同步方案。 |
复杂网络环境下的数据同步 | 实时同步支持阿里云云数据库,本地IDC、ECS自建数据库或非阿里云数据库等环境下的数据同步。配置前需确保资源组与源端/目的端的网络连通性,配置详情请参见:网络连通方案。 |
同步场景 | 实时同步支持单表实时数据同步至目标端单表、分库分表实时增量数据同步至目标端单表。
|
实时同步任务配置 | 实时同步任务配置时支持的能力如下,您无需编写代码,通过简单的任务配置即可实现单表ETL实时数据的收集。详情请参见:配置单表实时同步任务,分库分表同步至MaxCompute。 单表实时同步:
分库分表实时同步:
|
实时同步任务运维 | 支持对同步任务设置监控报警
|
实时同步不支持在数据开发界面运行任务,您需要保存、提交实时同步节点后,在生产环境运维中心运行该节点。
实时同步任务不支持同步视图。
支持的数据源
数据开发和数据集成支持的数据源有部分重叠,如您需要使用的类型在数据集成侧已支持,更推荐在数据集成侧创建实时同步任务。
数据集成侧支持的数据源的源端和目的端并非任意组合,具体支持类型见配置来源和去向数据源时的支持的同步类型。
数据开发
源端:MySQL、DataHub、LogHub、Kafka、PolarDB。
目的端:MaxCompute、Hologres、AnalyticDB MySQL 3.0、Elasticsearch、DataHub、Kafka。
数据处理:数据过滤、字符串替换、数据脱敏。
数据集成
源端:Kafka、Hologres、Oracle、LogHub、DataHub。
目的端:ApsaraDB for OceanBase、Data Lake Formation(DLF)、Doris、Hologres、MaxCompute、OSS、OSS-HDFS、StarRocks、Tablestore。
数据处理:数据过滤、字符串替换、数据脱敏、JSON解析、字段编辑与赋值。
开始使用
创建单表实时同步任务参见:DataStudio侧实时同步任务配置、数据集成侧实时同步任务配置。
创建分库分表实时同步任务参见:分库分表同步至MaxCompute。
常见问题
实时同步任务常见问题请参见实时同步常见问题。