数据集成(DataWorks)是阿里云重要的PaaS平台产品,对外提供稳定高效、弹性伸缩的数据同步平台,致力于在复杂网络环境下、丰富的异构数据源之间高速稳定地同步数据。

DataWorks支持的数据类型

DataWorks数据同步支持丰富的数据源:

  • 文本存储,例如FTP、SFTP、OSS、多媒体文件等;
  • 数据库,例如RDS、DRDS、MySQL、PostgreSQL等;
  • NoSQL数据库,例如Memcache、Redis、MongoDB、HBase等;
  • 大数据,例如MaxCompute、分析型数据库MySQL版、HDFS等;
  • MPP数据库,例如HybridDB for MySQL等;
  • 更多DataWorks支持的数据源请参见支持的数据源与读写插件

前提条件

  • 根据RDS快速入门,准备好测试数据。
  • 根据AnalyticDB for MySQL快速入门,完成创建实例、设置白名单、申请外网地址等准备工作。
    说明 由于DataWorks和AnalyticDB for MySQL之间暂时无法通过VPC连接,只能通过AnalyticDB for MySQL的外网地址进行连接,因此需要为AnalyticDB for MySQL申请外网地址。
  • 在AnalyticDB for MySQL数据库中创建表,用于存储同步过来的RDS MySQL数据。
    说明 通过DataWorks同步数据到AnalyticDB for MySQL中时,推荐您使用实时导入的方式,导入效率高而且流程简单,此方式需要您在AnalyticDB for MySQL数据库中提前创建实时表(普通表)。
  • 在DataWorks中创建一个项目

实施步骤

  1. 配置RDS MySQL数据源
  2. 配置AnalyticDB for MySQL数据源
  3. 配置同步任务中的数据来源和去向