如果同步的源数据库类型为MySQL,如自建MySQL、RDS MySQL,您需要在配置具体的同步任务前,参考本文的注意事项及限制,以保障数据同步任务的正常运行。
源库为MySQL的同步方案概览
根据如下同步方案,查看同步任务的注意事项及限制:- MySQL(RDS MySQL、自建MySQL)
- PolarDB MySQL
- 云原生数据仓库AnalyticDB MySQL 2.0
- 云原生数据仓库AnalyticDB MySQL 3.0
- 云原生数据仓库AnalyticDB PostgreSQL
- Elasticsearch
- ClickHouse集群
- Tablestore
- PolarDB-X 2.0
- Oracle
- PostgreSQL
- MySQL间的同步
- MySQL同步至PolarDB MySQL
- MySQL同步至云原生数据仓库AnalyticDB MySQL 2.0
- MySQL同步至云原生数据仓库AnalyticDB MySQL 3.0
- MySQL同步至云原生数据仓库AnalyticDB PostgreSQL
- MySQL同步至阿里云流式数据服务DataHub
- MySQL同步至Elasticsearch
- MySQL同步至MaxCompute
- MySQL同步至ClickHouse集群
- MySQL同步至Tablestore
- MySQL同步至阿里云消息队列Kafka版、自建Kafka集群
- MySQL同步至PolarDB-X
- MySQL同步至Oracle
- MySQL同步至PostgreSQL
MySQL间的同步
如果同步的目标数据库类型为MySQL,如RDS MySQL、自建MySQL,具体注意事项及限制如下:- MySQL间单向同步
类型 说明 源库限制 - 待同步的表需具备主键或唯一约束,且字段具有唯一性,否则可能会导致目标数据库中出现重复数据。
- 如同步对象为表级别,且需进行编辑(如表列名映射),则单次同步任务仅支持同步至多1000张表。当超出数量限制,任务提交后会显示请求报错,此时建议您拆分待同步的表,分批配置多个任务,或者配置整库的同步任务。
- Binlog日志:
-
需开启Binlog,开启方法请参见设置实例参数,并且binlog_row_image为full。否则预检查阶段提示报错,且无法成功启动数据同步任务。注意
- 如源实例为自建MySQL,则需开启Binlog,并且binlog_format为row、binlog_row_image为full。
- 如源实例自建MySQL是双主集群(两者互为主从),为保障DTS能获取全部的Binlog日志,则您需开启参数log_slave_updates。具体操作请参见为自建MySQL创建账号并设置binlog。
-
如为增量同步任务,DTS要求源数据库的本地Binlog日志保存24小时以上,如为全量同步和增量同步任务,DTS要求源数据库的本地Binlog日志至少保留7天以上(您可在全量同步完成后将Binlog保存时间设置为24小时以上),否则DTS可能因无法获取Binlog而导致任务失败,极端情况下甚至可能会导致数据不一致或丢失。由于您所设置的Binlog日志保存时间低于DTS要求的时间进而导致的问题,不在DTS的SLA保障范围内。如源为RDS MySQL,具体操作请参见本地日志(Binlog)。
-
其他限制 - 建议源和目标库版本保持一致,或者从低版本同步到高版本以保障兼容性。如为高版本同步至低版本,可能存在数据库兼容性问题。
- 执行数据同步前需评估源库和目标库的性能,同时建议业务低峰期执行数据同步。否则全量数据初始化时将占用源库和目标库一定的读写资源,可能会导致数据库的负载上升。
- 全量初始化会并发执行INSERT操作,导致目标数据库的表产生碎片,因此全量初始化完成后目标实例的表空间比源实例的表空间大。
- 如同步对象为单个或多个表(非整库),那么在数据同步时,勿对源库的同步对象使用gh-ost或pt-online-schema-change等类似工具执行在线DDL变更,否则会导致同步失败。
您可以使用数据管理DMS(Data Management Service)来执行在线DDL变更,请参见不锁表结构变更。
- 在DTS同步期间,不允许有除DTS外的数据写入目标库,否则会导致源库与目标库数据不一致。例如,有除DTS外的数据写入目标库时,使用DMS执行在线DDL变更,可能引起目标库数据丢失。
其他注意事项 当源库为自建MySQL时- 在同步时,如果源库进行主备切换,将会导致同步任务失败。
- 由于DTS的延迟时间是根据同步到目标库最后一条数据的时间戳和当前时间戳对比得出,源库长时间未执行DML操作可能导致延迟信息不准确。如果任务显示的延迟时间过大,您可以在源库执行一个DML操作来更新延迟信息。
说明 如果同步对象选择为整库,您还可以创建心跳表,心跳表每秒定期更新或者写入数据。
- MySQL间双向同步
类型 说明 源和目标库限制 - 待同步的表需具备主键或唯一约束,且字段具有唯一性,否则可能会导致目标数据库中出现重复数据。
- 如同步对象为表级别,且需进行编辑(如表列名映射),则单次同步任务仅支持同步至多1000张表。当超出数量限制,任务提交后会显示请求报错,此时建议您拆分待同步的表,分批配置多个任务,或者配置整库的同步任务。
- Binlog日志:
-
需开启Binlog,开启方法请参见设置实例参数,并且binlog_row_image为full。否则预检查阶段提示报错,且无法成功启动数据同步任务。注意
- 如源实例为自建MySQL,则需开启Binlog,并且binlog_format为row、binlog_row_image为full。
- 如源实例自建MySQL是双主集群(两者互为主从),为保障DTS能获取全部的Binlog日志,则您需开启参数log_slave_updates。具体操作请参见为自建MySQL创建账号并设置binlog。
-
如为增量同步任务,DTS要求源数据库的本地Binlog日志保存24小时以上,如为全量同步和增量同步任务,DTS要求源数据库的本地Binlog日志至少保留7天以上(您可在全量同步完成后将Binlog保存时间设置为24小时以上),否则DTS可能因无法获取Binlog而导致任务失败,极端情况下甚至可能会导致数据不一致或丢失。由于您所设置的Binlog日志保存时间低于DTS要求的时间进而导致的问题,不在DTS的SLA保障范围内。如源为RDS MySQL,具体操作请参见本地日志(Binlog)。
-
其他限制 - 建议源和目标库版本保持一致,或者从低版本同步到高版本以保障兼容性。如为高版本同步至低版本,可能存在数据库兼容性问题。
- 双向同步任务时,DTS会在目标库中建立数据库dts,以避免数据循环同步,任务运行期间,请勿修改该库。
- 如双向同步任务的源实例或目标实例位于海外地域,则仅支持同地域的双向同步,不支持跨地域的双向同步。例如,支持日本地域间的双向同步,不支持日本地域与法兰克福地域间的双向同步。
- 执行数据同步前需评估源库和目标库的性能,同时建议业务低峰期执行数据同步。否则全量数据初始化时将占用源库和目标库一定的读写资源,可能会导致数据库的负载上升。
- 全量初始化会并发执行INSERT操作,导致目标数据库的表产生碎片,因此全量初始化完成后目标实例的表空间比源实例的表空间大。
- 如同步对象为单个或多个表(非整库),那么在数据同步时,勿对源库的同步对象使用gh-ost或pt-online-schema-change等类似工具执行在线DDL变更,否则会导致同步失败。
您可以使用数据管理DMS(Data Management Service)来执行在线DDL变更,请参见不锁表结构变更。
- 在DTS同步期间,不允许有除DTS外的数据写入目标库,否则会导致源库与目标库数据不一致。例如,有除DTS外的数据写入目标库时,使用DMS执行在线DDL变更,可能引起目标库数据丢失。
- DTS默认同步到目标数据库中时会取消外键约束,因此源数据库的级联、删除等操作不会同步到目标数据库。
- 正向和反向同步任务均同步了某个表,且正向同步任务同步了该表的全量和增量数据,则反向同步任务只同步该表的增量数据。
特殊情况 当源库为自建MySQL时- 在同步时,如果源库进行主备切换,将会导致同步任务失败。
- 由于DTS的延迟时间是根据同步到目标库最后一条数据的时间戳和当前时间戳对比得出,源库长时间未执行DML操作可能导致延迟信息不准确。如果任务显示的延迟时间过大,您可以在源库执行一个DML操作来更新延迟信息。
说明 如果同步对象选择为整库,您还可以创建心跳表,心跳表每秒定期更新或者写入数据。
MySQL同步至PolarDB MySQL
- MySQL单向同步至PolarDB MySQL
类型 说明 源库限制 - 待同步的表需具备主键或唯一约束,且字段具有唯一性,否则可能会导致目标数据库中出现重复数据。
- 如同步对象为表级别,且需进行编辑(如表列名映射),则单次同步任务仅支持同步至多1000张表。当超出数量限制,任务提交后会显示请求报错,此时建议您拆分待同步的表,分批配置多个任务,或者配置整库的同步任务。
- Binlog日志:
-
需开启Binlog,开启方法请参见设置实例参数,并且binlog_row_image为full。否则预检查阶段提示报错,且无法成功启动数据同步任务。注意
- 如源实例为自建MySQL,则需开启Binlog,并且binlog_format为row、binlog_row_image为full。
- 如源实例自建MySQL是双主集群(两者互为主从),为保障DTS能获取全部的Binlog日志,则您需开启参数log_slave_updates。具体操作请参见为自建MySQL创建账号并设置binlog。
-
如为增量同步任务,DTS要求源数据库的本地Binlog日志保存24小时以上,如为全量同步和增量同步任务,DTS要求源数据库的本地Binlog日志至少保留7天以上(您可在全量同步完成后将Binlog保存时间设置为24小时以上),否则DTS可能因无法获取Binlog而导致任务失败,极端情况下甚至可能会导致数据不一致或丢失。由于您所设置的Binlog日志保存时间低于DTS要求的时间进而导致的问题,不在DTS的SLA保障范围内。如源为RDS MySQL,具体操作请参见本地日志(Binlog)。
-
其他限制 - 建议源和目标库版本保持一致,或者从低版本同步到高版本以保障兼容性。如为高版本同步至低版本,可能存在数据库兼容性问题。
- 执行数据同步前需评估源库和目标库的性能,同时建议业务低峰期执行数据同步。否则全量数据初始化时将占用源库和目标库一定的读写资源,可能会导致数据库的负载上升。
- 全量初始化会并发执行INSERT操作,导致目标数据库的表产生碎片,因此全量初始化完成后目标实例的表空间比源实例的表空间大。
- 如同步对象为单个或多个表(非整库),那么在数据同步时,勿对源库的同步对象使用gh-ost或pt-online-schema-change等类似工具执行在线DDL变更,否则会导致同步失败。
您可以使用数据管理DMS(Data Management Service)来执行在线DDL变更,请参见不锁表结构变更。
- 在DTS同步期间,不允许有除DTS外的数据写入目标库,否则会导致源库与目标库数据不一致。例如,有除DTS外的数据写入目标库时,使用DMS执行在线DDL变更,可能引起目标库数据丢失。
特殊情况 当源库为自建MySQL时- 在同步时,如果源库进行主备切换,将会导致同步任务失败。
- 由于DTS的延迟时间是根据同步到目标库最后一条数据的时间戳和当前时间戳对比得出,源库长时间未执行DML操作可能导致延迟信息不准确。如果任务显示的延迟时间过大,您可以在源库执行一个DML操作来更新延迟信息。
说明 如果同步对象选择为整库,您还可以创建心跳表,心跳表每秒定期更新或者写入数据。
- MySQL双向同步至PolarDB MySQL
类型 说明 源和目标库限制 - 待同步的表需具备主键或唯一约束,且字段具有唯一性,否则可能会导致目标数据库中出现重复数据。
- 如同步对象为表级别,且需进行编辑(如表列名映射),则单次同步任务仅支持同步至多1000张表。当超出数量限制,任务提交后会显示请求报错,此时建议您拆分待同步的表,分批配置多个任务,或者配置整库的同步任务。
- Binlog日志:
- MySQL:
需开启Binlog,开启方法请参见设置实例参数,并且binlog_row_image为full。否则预检查阶段提示报错,且无法成功启动数据同步任务。注意
- 如源实例为自建MySQL,则需开启Binlog,并且binlog_format为row、binlog_row_image为full。
- 如源实例自建MySQL是双主集群(两者互为主从),为保障DTS能获取全部的Binlog日志,则您需开启参数log_slave_updates。具体操作请参见为自建MySQL创建账号并设置binlog。
- PolarDB MySQL:
需开启Binlog,并且loose_polar_log_bin为on。否则预检查阶段显示报错提示,且无法成功启动数据同步任务。
-
如为增量同步任务,DTS要求源数据库的本地Binlog日志保存24小时以上,如为全量同步和增量同步任务,DTS要求源数据库的本地Binlog日志至少保留7天以上(您可在全量同步完成后将Binlog保存时间设置为24小时以上),否则DTS可能因无法获取Binlog而导致任务失败,极端情况下甚至可能会导致数据不一致或丢失。由于您所设置的Binlog日志保存时间低于DTS要求的时间进而导致的问题,不在DTS的SLA保障范围内。如源为RDS MySQL,具体操作请参见本地日志(Binlog)。
- MySQL:
其他限制 - 建议源和目标库版本保持一致,或者从低版本同步到高版本以保障兼容性。如为高版本同步至低版本,可能存在数据库兼容性问题。
- 双向同步任务时,DTS会在目标库中建立数据库dts,以避免数据循环同步,任务运行期间,请勿修改该库。
- 如双向同步任务的源实例或目标实例位于海外地域,则仅支持同地域的双向同步,不支持跨地域的双向同步。例如,支持日本地域间的双向同步,不支持日本地域与法兰克福地域间的双向同步。
- 执行数据同步前需评估源库和目标库的性能,同时建议业务低峰期执行数据同步。否则全量数据初始化时将占用源库和目标库一定的读写资源,可能会导致数据库的负载上升。
- 全量初始化会并发执行INSERT操作,导致目标数据库的表产生碎片,因此全量初始化完成后目标实例的表空间比源实例的表空间大。
- 如同步对象为单个或多个表(非整库),那么在数据同步时,勿对源库的同步对象使用gh-ost或pt-online-schema-change等类似工具执行在线DDL变更,否则会导致同步失败。
您可以使用数据管理DMS(Data Management Service)来执行在线DDL变更,请参见不锁表结构变更。
- 在DTS同步期间,不允许有除DTS外的数据写入目标库,否则会导致源库与目标库数据不一致。例如,有除DTS外的数据写入目标库时,使用DMS执行在线DDL变更,可能引起目标库数据丢失。
- DTS默认同步到目标数据库中时会取消外键约束,因此源数据库的级联、删除等操作不会同步到目标数据库。
- 正向和反向同步任务均同步了某个表,且正向同步任务同步了该表的全量和增量数据,则反向同步任务只同步该表的增量数据。
特殊情况 当源库为自建MySQL时- 在同步时,如果源库进行主备切换,将会导致同步任务失败。
- 由于DTS的延迟时间是根据同步到目标库最后一条数据的时间戳和当前时间戳对比得出,源库长时间未执行DML操作可能导致延迟信息不准确。如果任务显示的延迟时间过大,您可以在源库执行一个DML操作来更新延迟信息。
说明 如果同步对象选择为整库,您还可以创建心跳表,心跳表每秒定期更新或者写入数据。
MySQL同步至云原生数据仓库AnalyticDB MySQL 2.0
类型 | 说明 |
---|---|
源库限制 |
|
其他限制 |
|
特殊情况 |
当源库为自建MySQL时
|
MySQL同步至云原生数据仓库AnalyticDB MySQL 3.0
类型 | 说明 |
---|---|
源库限制 |
|
其他限制 |
|
特殊情况 |
当源库为自建MySQL时
|
MySQL同步至云原生数据仓库AnalyticDB PostgreSQL
类型 | 说明 |
---|---|
源库限制 |
|
其他限制 |
|
特殊情况 |
当源库为自建MySQL时
|
MySQL同步至阿里云流式数据服务DataHub
类型 | 说明 |
---|---|
源库限制 |
|
其他限制 |
|
特殊情况 |
当源库为自建MySQL时
|
MySQL同步至Elasticsearch
类型 | 说明 |
---|---|
源库限制 |
|
其他限制 |
|
特殊情况 |
当源库为自建MySQL时
|
MySQL同步至MaxCompute
类型 | 说明 |
---|---|
源库限制 |
|
其他限制 |
|
特殊情况 |
当源库为自建MySQL时
|
MySQL同步至ClickHouse集群
类型 | 说明 |
---|---|
源库限制 |
|
注意事项 |
|
特殊情况 |
当源库为自建MySQL时
|
MySQL同步至Tablestore
类型 | 说明 |
---|---|
源库限制 |
|
其他限制 |
|
特殊情况 |
当源库为自建MySQL时
|
MySQL同步至阿里云消息队列Kafka版、自建Kafka集群
类型 | 说明 |
---|---|
源库的环境要求 |
|
注意事项 |
|
特殊情况 |
当源库为自建MySQL时
|
MySQL同步至PolarDB-X 2.0
类型 | 说明 |
---|---|
源库的环境要求 |
|
注意事项 |
|
特殊情况 |
当源库为自建MySQL时
|
MySQL同步至Oracle
类型 | 说明 |
---|---|
源库限制 |
|
其他限制 |
|
特殊情况 |
当源库为自建MySQL时
|
MySQL同步至PostgreSQL
类型 | 说明 |
---|---|
源库限制 |
|
其他限制 |
|
特殊情况 |
当源库为自建MySQL时
|