全部产品
云市场

概述

更新时间:2019-07-12 20:56:49

数据集成(DataWorks)是阿里云重要的PaaS平台产品,对外提供稳定高效、弹性伸缩的数据同步平台,致力于在复杂网络环境下、丰富的异构数据源之间高速稳定地同步数据。

DataWorks支持的数据源类型

DataWorks数据同步支持丰富的数据源:

文本存储,例如FTP、SFTP、OSS、多媒体文件等。

数据库,例如RDS、DRDS、MySQL、PostgreSQL等。

NoSQL数据库,例如Memcache、Redis、MongoDB、HBase等。

大数据,例如MaxCompute、分析型数据库MySQL版、HDFS等。

MPP数据库,例如HybridDB for MySQL等。

DataWorks支持的数据源详情,请参见数据源

前提条件

  • 根据RDS for MySQL快速入门,准备好测试数据。

  • 根据AnalyticDB for MySQL快速入门,完成创建实例、设置白名单、申请外网地址等准备工作。

    注意:由于DataWorks和AnalyticDB for MySQL 3.0之间暂时无法通过VPC连接,但可以通过AnalyticDB for MySQL 3.0的外网地址进行连接,因此需要您为AnalyticDB for MySQL 3.0申请外网地址。

  • 在AnalyticDB for MySQL数据库中创建实时表(普通表),用于存储同步过来的RDS for MySQL数据。

    通过DataWorks同步数据到AnalyticDB for MySQL中时,推荐您使用实时导入的方式,导入效率高而且流程简单,但需要您在AnalyticDB for MySQL数据库中提前创建实时表(普通表)。

  • 在DataWorks中创建一个项目

实施步骤

  1. 配置RDS for MySQL数据源

  2. 配置AnalyticDB for MySQL数据源

  3. 配置同步任务中的数据来源和去向