MySQL数据源为您提供读取和写入MySQL双向通道的功能,方便您后续可以通过向导模式和脚本模式配置数据同步任务。本文为您介绍,配置数据源之前需要准备的网络环境及账号权限,以及在DataWorks中如何新增MySQL数据源。
前提条件
配置数据源之前,请确保已完成以下规划与准备工作。
- 准备数据源:已购买来源数据源MySQL。
- 已配置同步账号权限,详情请参见配置账号权限。
实时同步通过数据源配置账号访问MySQL,在实时同步场景下,您需要确保此账号拥有数据库的
SELECT
、REPLICATION SLAVE
、REPLICATION CLIENT
权限。 - 已开启MySQL Binlog服务,详情请参见开启MySQL Binlog。
数据集成通过实时订阅MySQL Binlog实现增量数据实时同步,您需要在DataWorks配置同步任务前,先开启MySQL Binlog服务。
- 已购买合适规格的独享数据集成资源组。详情请参见新增和使用独享数据集成资源组。
- 已配置数据同步资源组与数据库的网络连通,详情请参见配置资源组与网络连通。
背景信息
标准模式的工作空间支持数据源隔离功能,您可以分别添加并隔离开发环境和生产环境的数据源,以保护您的数据安全。详情请参见数据源开发和生产环境隔离。使用限制
- DataWorks的数据集成实时同步MySQL数据是基于实时订阅MySQL实现的,实时同步MySQL数据目前仅支持配置MySQL数据源为RDS的
5.x
或8.x
版本的MySQL,请不要将DRDS的MySQL配置为MySQL数据源,您可以参考配置DRDS数据源文档直接将其配置为DRDS数据源。 - 不支持XA ROLLBACK,针对已经XA PREPARE的事务数据,实时同步会将其同步到目标端,如果XA ROLLBACK,实时同步不会针对XA PREPARE的数据做回滚写入的操作。若要处理XA ROLLBACK场景,需要手动将XA ROLLBACK的表从实时同步任务中移除,再添加表后重新进行全量数据初始化以及增量实时同步。
- 在添加MySQL数据源时,若添加了其他阿里云账号下的MySQL实例,后续同步任务配置该数据源时,仅支持使用独享数据集成资源组运行该同步任务,公共资源组无法访问该数据源中的数据。
新增MySQL数据源
- 进入数据源管理页面。
- 登录DataWorks控制台。
- 在左侧导航栏,单击工作空间列表。
- 选择工作空间所在地域后,鼠标悬浮至
图标,单击工作空间配置。
- 在左侧导航栏,单击 ,进入 页面。
说明 您也可以在数据集成页面进入数据源管理配置数据源,但此方式只支持生产环境的数据源。 - 在数据源管理页面,单击右上角的新增数据源。
- 在新增数据源对话框中,选择数据源类型为MySQL。
- 在新增MySQL数据源对话框中,配置各项参数。
- 选择资源组连通性类型为数据集成。
- 在资源组列表,单击相应资源组后的测试连通性。数据同步时,一个任务只能使用一种资源组。您需要测试每个资源组的连通性,以保证同步任务使用的数据集成资源组能够与数据源连通,否则将无法正常执行数据同步任务。如果您需要同时测试多种资源组,请选中相应资源组后,单击批量测试连通性。详情请参见配置资源组与网络连通。说明
- (推荐)资源组列表默认仅显示独享数据集成资源组,为确保数据同步的稳定性和性能要求,推荐使用独享数据集成资源组。
- 如果您需要测试公共资源组或自定义资源组的连通性,请在资源组列表右下方,单击更多选项,在警告对话框单击确定,资源组列表会显示可供选择的公共资源组和自定义资源组。
- 测试连通性通过后,单击完成。