文档

通过DataWorks导入

更新时间:

HDFS是一个分布式文件系统,为您提供读取和写入HDFS双向通道的功能,本文为您介绍如何通过DataWorks将HDFS数据导入至AnalyticDB MySQL版湖仓版(3.0)数仓版(3.0)

前提条件

  • 已完成数据源配置。您需要在数据集成同步任务配置前,配置好您需要同步的源端和目标端数据库,以便在同步任务配置过程中,可通过选择数据源名称来控制同步任务的读取和写入数据库。离线同步支持的数据源及其配置详情请参见支持的数据源与读写插件

    说明

    数据源相关能力介绍详情请参见:数据源概述

  • 已购买合适规格的独享数据集成资源组。详情请参见:新增和使用独享数据集成资源组

  • 独享数据集成资源组与数据源网络已打通。详情请参见:配置资源组与网络连通

操作步骤

  1. 配置同步的源端数据库读插件。具体操作,请参见HDFS Reader

  2. 配置同步的目标端数据库写插件。具体操作,请参见AnalyticDB for MySQL 3.0 Writer

  3. 配置同步任务。具体操作,请参见通过向导模式配置离线同步任务