后续:离线同步数据质量问题与同步任务调优 离线同步任务调优 离线同步数据质量排查 离线同步任务运维常见问题 为什么数据源测试连通性成功,但是离线同步任务执行失败?如何切换数据集成任务执行资源组?脏数据如何排查和定位?如何排查离...
离线同步任务配置相关能力 支持的能力 说明 全量或增量数据同步 离线同步任务可以通过配置 数据过滤 并结合调度参数使用,来决定同步全量数据还是增量数据。不同插件增量同步配置方式不同,关于增量数据同步配置详情请参见:场景:配置增量...
在任务中心,当离线同步实例未成功运行时,您可以重跑离线同步实例,重新运行离线任务。本文主要介绍如何重跑离线同步实例。背景信息 只有全量任务支持重跑,增量任务不支持。操作步骤 登录 数据资源平台控制台。在页面左上角,单击 图标,...
本文为您介绍如何查看离线同步任务执行过程中的日志详情。进入日志详情页 您可以在运维中心或DataStudio界面查看任务运行日志。模块 描述 运维中心 您可以进入 周期实例、测试实例、补数据实例 等页面,通过筛选条件过滤出需要查询的实例,...
离线同步实例是由离线数据同步时发起的任务实例,运维监控支持查看离线同步任务实例的详情,包括实例属性、运行日志。本文主要介绍查看离线同步实例的详情。前提条件 已上线离线同步任务,具体操作,请参见 上线离线数据同步任务。操作步骤...
本文为您介绍离线同步的相关问题。文档概述 问题分类 相关文档 离线同步任务运维常见问题 为什么数据源测试连通性成功,但是离线同步任务执行失败?如何切换数据集成任务执行资源组?脏数据如何排查和定位?如何查看脏数据?如果离线同步...
在任务中心,当离线同步实例未成功运行时,您可以重跑离线同步实例,重新运行离线任务。本文主要介绍如何重跑离线同步实例。背景信息 只有全量任务支持重跑,增量任务不支持。操作步骤 登录企业数据智能平台。在页面左上角,单击 图标,...
离线同步实例是由离线数据同步时发起的任务实例,运维监控支持查看离线同步任务实例的详情,包括实例属性、运行日志。本文主要介绍查看离线同步实例的详情。前提条件 已上线离线同步任务,具体操作,请参见 上线离线数据同步任务。操作步骤...
step2:创建离线同步节点,并配置离线同步任务 在DataWorks的DataStudio中创建一个离线同步节点,并配置离线同步的来源与去向等任务配置参数,核心配置要点如下,其他参数可保持默认值即可。详细操作请参见 通过向导模式配置离线同步任务。...
step2:创建离线同步节点,并配置离线同步任务 在DataWorks的DataStudio中创建一个离线同步节点,并配置离线同步的来源与去向等任务配置参数,核心配置要点如下,其他参数可保持默认值即可。详细操作请参见 通过向导模式配置离线同步任务。...
整库离线同步方案包括周期性全量同步、周期性增量同步、一次性全量同步、一次性增量同步、一次性全量周期性增量同步。本文以一次性全量周期性增量同步至OSS为例,为您讲解如何将整库数据离线同步至OSS。前提条件 已完成数据源配置。您需要...
本文以OSS离线同步写入MaxCompute场景为例,为您介绍OSS离线同步在数据源配置、网络联通、同步任务配置方面的最佳实践。背景信息 阿里云对象存储OSS(Object Storage Service)是一款海量、安全、低成本、高可靠的云存储服务,提供99....
整库离线同步方案包括周期性全量同步、周期性增量同步、一次性全量同步、一次性增量同步、一次性全量周期性增量同步。本文以一次性全量周期性增量同步至MaxCompute为例,为您讲解如何将整库数据离线同步至MaxCompute。前提条件 已完成数据...
整库离线同步方案包括周期性全量同步、周期性增量同步、一次性全量同步、一次性增量同步、一次性全量周期性增量同步。本文以一次性全量周期性增量同步至MaxCompute为例,为您讲解如何将整库数据离线同步至MaxCompute。前提条件 已完成数据...
本文以OSS离线同步写入MaxCompute场景为例,为您介绍OSS离线同步在数据源配置、网络联通、同步任务配置方面的最佳实践。背景信息 阿里云对象存储OSS(Object Storage Service)是一款海量、安全、低成本、高可靠的云存储服务,提供99....
本文以MaxCompute离线同步写入ClickHouse场景为例,为您介绍ClickHouse离线同步在数据源配置、网络联通、同步任务配置方面的最佳实践。背景信息 云数据库ClickHouse是面向联机分析处理的列式数据库。数据集成支持从ClickHouse同步数据到...
背景信息 数据集成离线同步,为您提供数据读取(Reader)和写入插件(Writer)实现数据的读取与写入,您可通过向导模式和脚本模式配置离线同步任务,实现源端单表同步至目标端单表、源端分库分表同步至目标端单表两类数据同步场景。...
Hologres支持通过DataWorks平台将数据库中的数据离线同步至Hologres,进行高并发低延时的查询分析处理操作。本文将为您介绍使用DataWorks将各类数据库数据离线同步至Hologres的操作方法。前提条件 开通DataWorks,详情请参见 入门概述。...
当您需要实现更精细化的配置管理时,您可以使用脚本模式配置离线同步任务,通过编写数据同步的JSON脚本并结合DataWorks调度参数使用,将源端单表或分库分表的全量或增量数据周期性同步至目标数据表。本文为您介绍脚本模式配置离线同步任务...
通过选择已注册的数据源端数据和目标端,实现全量任务自动建表的方式创建离线同步周期任务,本文介绍如何创建MySQL to MaxCompute离线同步周期任务。前提条件 已新建工作组“信息中心(xxzx)”,具体操作,请参见 新建工作组。已在工作组中...
整库离线同步方案包括周期性全量同步、周期性增量同步、一次性全量同步、一次性增量同步、一次性全量周期性增量同步。本文以一次性全量周期性增量同步至Elasticsearch为例,为您讲解如何将整库数据离线同步至Elasticsearch。前提条件 已...
本文示例以MySQL为源端,OSS为目标端,为您介绍如何将MySQL整个数据库的数据离线同步到OSS。使用限制 仅支持使用独享数据集成资源组。操作步骤 步骤一:创建同步任务。步骤二:配置同步任务。步骤三:运行并查看任务状态。前提条件 已购买...
DataWorks支持通过向导模式或脚本模式配置离线同步任务,您可以将分库分表数据同步至目标单表。本文以同步MySQL分库分表数据为例进行说明。前提条件 已准备好要同步的多个数据源,详情请参见 支持的数据源与读写插件。背景信息 分库分表...
本文以ClickHouse离线同步写入Hologres场景为例,为您介绍如何一次性把ClickHouse整个数据库的数据离线同步至Hologres。使用限制 ClickHouse离线同步仅支持阿里云ClickHouse 20.8、21.8版本。ClickHouse离线同步仅支持使用独享数据集成资源...
离线同步任务使用的调度资源组 离线同步任务将有调度资源下发至数据集成任务执行资源上执行,调度资源使用情况同样会影响整体数据集成同步效率。关于离线任务下发机制,详情请参见:任务下发机制。离线同步任务配置 传输速度:是否设置任务...
本文以阿里云EMR Hive离线同步写入MaxCompute场景为例,为您介绍如何一次性把EMR Hive整个数据库的数据离线同步至MaxCompute。背景信息 Hive是基于Hadoop的一个数据仓库工具,用来进行数据的提取、转化、加载,可以存储、查询和分析存储在...
本文以阿里云EMR Hive离线同步写入MaxCompute场景为例,为您介绍如何一次性把EMR Hive整个数据库的数据离线同步至MaxCompute。背景信息 Hive是基于Hadoop的一个数据仓库工具,用来进行数据的提取、转化、加载,可以存储、查询和分析存储在...
本文将为您介绍离线同步并发和限流之间的关系。实践内容 并发数 阅读此部分,您可以解决和理解如下问题:问题一:如何配置数据同步任务的并发数?问题二:为什么我的数据同步任务跑的比较慢,实际运行的并发数不够?问题三:为什么我的同步...
DataWorks的离线同步节点不支持通过自动解析自动添加调度依赖,包含离线同步节点的业务流程,如果下游节点依赖离线同步节点产生的表,您需手动添加产出表到离线同步节点的输出中,下游节点查询离线同步节点数据时,自动解析可以通过表快速...
配置任务脏数据阈值,详情请参见 通过向导模式配置离线同步任务,关于脏数据认定,详情请参见 基本概念。数据同步执行过程中就进行了数据查询 部分Writer插件在数据同步完成前,会有同步完成才可见(比如Hive、MaxCompute(可配)等)、...
离线周期任务创建完成后,需对已新建的离线同步任务进行上线运行,本章节介绍如何运行MySQL to MaxCompute任务。前提条件 已新建工作组“信息中心(xxzx)”,具体操作,请参见 新建工作组。已在工作组中分别添加数据源类型为MaxCompute、RDS...
任务上线成功后,进入离线同步实例中,可查看实例运行状态、实例详情和重跑实例等,本章节介绍如何查看周期任务的运行情况。前提条件 已新建工作组“信息中心(xxzx)”,具体操作,请参见 新建工作组。已在工作组中分别添加数据源类型为...
离线同步任务支持您通过配置类似的数据过滤功能来决定同步全量数据还是增量数据,配置过滤条件时,将只同步满足过滤条件的数据。同时,过滤条件可以结合调度参数使用,实现过滤条件随任务调度时间的动态变化,进而实现增量数据的同步。该...
调用 CreateDISyncTask 创建数据集成同步任务,仅支持使用脚本模式配置同步任务内容,详情请参见 通过脚本模式配置离线同步任务。DataWorks暂不支持使用OpenAPI创建业务流程,您需要使用现有的业务流程创建数据同步任务。配置环境依赖及...
使用限制 调用 CreateDISyncTask 创建数据集成同步任务,仅支持使用脚本模式配置同步任务内容,详情请参见 通过脚本模式配置离线同步任务。DataWorks暂不支持使用OpenAPI创建业务流程,您需要使用现有的业务流程创建数据同步任务。配置环境...