数据集成(DataWorks)是阿里云重要的PaaS平台产品,对外提供稳定高效、弹性伸缩的数据同步平台,致力于在复杂网络环境下、丰富的异构数据源之间高速稳定地同步数据。
DataWorks支持的数据类型
DataWorks数据同步支持丰富的数据源:
- 文本存储,例如FTP、SFTP、OSS、多媒体文件等;
- 数据库,例如RDS、DRDS、MySQL、PostgreSQL等;
- NoSQL数据库,例如Memcache、Redis、MongoDB、HBase等;
- 大数据,例如MaxCompute、AnalyticDB MySQL、HDFS等;
- 更多DataWorks支持的数据源请参见支持的数据源与读写插件。
前提条件
- 根据RDS快速入门,准备好测试数据。
- 根据AnalyticDB MySQL使用流程,完成创建实例、设置白名单、申请外网地址等准备工作。
说明 由于DataWorks和AnalyticDB MySQL之间暂时无法通过VPC连接,只能通过AnalyticDB MySQL的外网地址进行连接,因此需要为AnalyticDB MySQL申请外网地址。
- 在AnalyticDB MySQL数据库中创建表,用于存储同步过来的RDS MySQL数据。
说明 通过DataWorks同步数据到AnalyticDB MySQL中时,推荐您使用实时导入的方式,导入效率高而且流程简单,此方式需要您在AnalyticDB MySQL数据库中提前创建实时表(普通表)。
- 在DataWorks中创建一个项目。