首页 云数据库 OceanBase 操作指南 数据传输 数据迁移 迁移 PolarDB-X 2.0 数据库的数据至 OceanBase 数据库 MySQL 租户

迁移 PolarDB-X 2.0 数据库的数据至 OceanBase 数据库 MySQL 租户

更新时间: 2023-11-29 10:11:27

本文为您介绍如何迁移 PolarDB-X 2.0 数据库的数据至 OceanBase 数据库 MySQL 租户。

重要

如果数据迁移项目长期处于非活跃状态(项目状态为 失败已暂停已完成),受增量日志保留时长等影响,项目可能无法恢复。数据传输将主动释放处于非活跃状态超过 7 天的数据迁移项目,以回收相关资源,建议您为项目配置告警并及时处理项目相关异常。

背景信息

云原生数据库 PolarDB 分布式版(简称 PolarDB-X)是由阿里巴巴自主研发的高性能云原生分布式数据库,为您提供高吞吐、大存储、低延时、易扩展和超高可用的云时代数据库服务。详情请参见 什么是云原生数据库 PolarDB 分布式版

前提条件

使用限制

  • 源端数据库的操作限制

    请勿在结构迁移和全量迁移阶段执行库或表结构变更的 DDL 操作,否则可能造成数据迁移项目中断。

  • 数据传输支持 PolarDB-X 2.0 数据库 5.4.x 版本。

  • 迁移 PolarDB-X 2.0 数据库的数据至 OceanBase 数据库 MySQL 租户时,不支持迁移 TTL 类型的表。

  • 待迁移的表需要具备主键或唯一约束,且字段具有唯一性,否则可能导致目标端数据库出现数据不一致的问题。

  • 数据传输仅支持迁移库名、表名和列名为 ASCII 码且不包含特殊字符(包括换行、空格,以及 .|"'`()=;/&)的对象。

  • 目标端是数据库的情况下,数据传输不支持目标端存在 Trigger。如果存在,可能导致数据迁移失败。

  • 数据迁移过程中,源端请勿进行扩容、缩容、变更拆分键、迁移热点表和变更 DDL 等操作,否则可能导致数据迁移项目失败。

  • OceanBase 数据库不支持自增列 AUTO_INCREMENT 作为分区列。如果源端存在 AUTO_INCREMENT 分区列,请手动修改建表语句。

注意事项

  • 如果您迁移 PolarDB-X 2.0 数据库的广播表,可能发生数据丢失等情况,无法确保数据的准确性。​

  • 如果源端字符集为 UTF-8,建议目标端使用兼容源端的字符集(例如,UTF-8、UTF-16 等),避免产生因字符集不兼容导致目标端出现乱码等问题。

  • 节点之间的时钟不同步,或者电脑终端和服务器之间的时钟不同步,均可能导致延迟时间(增量同步/反向增量)不准确。

    例如,如果时钟早于标准时间,可能导致延迟时间为负数。如果时钟晚于标准时间,可能导致延迟。

  • 请确认数据传输对 DECIMAL、FLOAT 或 DOUBLE 等列类型的迁移精度是否符合预期。如果目标端字段类型的精度小于源端字段类型的精度,则可能发生截断现象,导致源端和目标端的数据不一致。

  • 通过配置匹配规则的方式选择 CTAS 语句创建的表作为迁移对象时,建议您提前设置特定的规则(例如,a.*_2023_backup)来避免出现数据迁移项目中断的情况。

  • 迁移默认按照目标端参数lower_case_table_names = 1设置,并以小写方式创建目标端数据库对象。

  • 源端 PolarDB-X 2.0 数据库所在的服务器需要具备足够的出口带宽,否则会影响数据迁移的效率。

  • 全量迁移和增量同步过程中,数据传输会以 Session 级别暂时禁用约束检查和外键级联操作。如果源库存在级联更新、删除等操作,可能导致源端和目标端的数据不一致。

  • 如果您在数据迁移过程中切换 PolarDB-X 2.0 数据库的网络类型,请在切换成功后,调整数据迁移项目的网络连接信息。

  • 如果数据迁移项目中仅配置了全量迁移,请勿向源端实例写入新的数据,避免导致源端和目标端的数据不一致。建议您在配置数据迁移项目时,选择结构迁移+全量迁移+增量同步,以实时保持数据的一致性。

  • 如果您需要进行增量同步,Binlog 日志有以下注意事项:

    • 数据传输仅支持 PolarDB-X 2.0 提供的单流形态的 Binlog 日志消费订阅能力,详情请参见 Binlog日志服务

    • 您需要开启 Binlog 日志,并设置 binlog_row_image 为 full。否则预检查会报错,且无法成功启动数据迁移项目。

    • 如果创建数据迁移项目时,您仅配置了 增量同步,数据传输要求源端数据库的本地 Binlog 日志保存 24 小时以上。

      如果创建数据迁移项目时,您配置了 全量迁移+增量同步,数据传输要求源端数据库的本地 Binlog 日志至少保留 7 天以上。否则数据传输可能因为无法获取 Binlog 日志导致数据迁移项目失败,甚至导致源端和目标端数据不一致。

      说明

      您可以在全量迁移完成后,设置 Binlog 日志的保存时间为 24 小时以上。

  • 多表汇聚场景下:

    • 建议您使用导入对象和匹配规则的方式映射源端和目标端的关系。

    • 建议您自行在目标端创建表结构。如果使用数据传输创建,请在结构迁移步骤跳过部分失败对象。

  • 如果源端和目标端的表结构不完全一致,可能会出现数据不一致的情况。目前已知场景如下:

    • 用户手动创建表结构时,因超出数据传输的支持范围,可能产生隐式的转换问题导致源端和目标端列的类型不一致。

    • 目标端的数据长度小于源端的数据长度时,可能出现数据截断的情况,导致源端和目标端的数据不一致。

支持的源端和目标端实例类型

下表中,OceanBase 数据库 MySQL 租户简称为 OB_MySQL。

源端

目标端

PolarDB-X 2.0(阿里云 PolarDB-X 2.0 实例)

OB_MySQL(OceanBase 集群实例)

数据类型映射

PolarDB-X 2.0 数据库

OceanBase 数据库 MySQL 租户

INTEGER

INTEGER

TINYINT

TINYINT

MEDIUMINT

MEDIUMINT

BIGINT

BIGINT

SMALLINT

SMALLINT

DECIMAL

DECIMAL

NUMERIC

NUMERIC

FLOAT

FLOAT

REAL

REAL

DOUBLE PRECISION

DOUBLE PRECISION

BIT

BIT

CHAR

CHAR

VARCHAR

VARCHAR

BINARY

BINARY

VARBINARY

VARBINARY

BLOB

BLOB

TEXT

TEXT

ENUM

ENUM

重要

OceanBase 数据库 MySQL 租户 2.2.0 及以上版本支持该数据类型。

SET

SET

重要

OceanBase 数据库 MySQL 租户 2.2.0 及以上版本支持该数据类型。

JSON

JSON

重要

OceanBase 数据库 MySQL 租户 3.2.2 及以上版本支持该数据类型。

DATE

DATE

DATETIME

DATETIME

TIMESTAMP

TIMESTAMP

TIME

TIME

YEAR

YEAR

操作步骤

  1. 新建数据迁移项目。

    1. 登录 OceanBase 管理控制台

    2. 在左侧导航栏,单击 数据传输>数据迁移

    3. 数据迁移 页面,单击右上角的 新建迁移项目

  2. 选择源和目标 页面,配置各项参数。

    参数

    描述

    迁移项目名称

    建议使用中文、数字和字母的组合。名称中不能包含空格,长度不能超过 64 个字符。

    标签

    单击文本框,在下拉列表中选择目标标签。您也可以单击 管理标签,进行新建、修改和删除。详情请参见 通过标签管理数据迁移项目

    源端

    如果您已新建 PolarDB-X 2.0 数据源,请从下拉列表中进行选择。如果未新建,请单击下拉列表中的 新建数据源,在右侧对话框进行新建。参数详情请参见 新建 PolarDB-X 2.0 数据源

    目标端

    如果您已新建 OceanBase 数据库 MySQL 租户数据源,请从下拉列表中进行选择。如果未新建,请单击下拉列表中的 新建数据源,在右侧对话框进行新建。参数详情请参见 新建 OceanBase 数据源

    重要

    目标端仅支持 OceanBase 数据库 MySQL 租户的 实例类型OceanBase 集群实例

    传输实例

    从下拉列表中选择已购买的传输实例。如果您未购买,请单击右侧的 购买 进行操作。详情请参见 购买传输实例

  3. 单击 下一步

  4. 单击弹出提示框中的 我知道了

    请注意目前本项目仅支持具有主键或者非空唯一索引的表,其他表会自动过滤。

  5. 选择迁移类型 页面,配置各项参数。

    迁移类型支持 结构迁移全量迁移增量同步全量校验反向增量

    迁移类型

    描述

    结构迁移

    结构迁移任务开始后,数据传输会迁移源库中的数据对象定义(表、索引、约束、注释和视图等)至目标端数据库中,并自动过滤临时表。

    PoarDB-X 2.0 数据库至 OceanBase 数据库 MySQL 租户的结构迁移支持 DRDS 和 AUTO 两种模式库表结构。

    重要

    AUTO 模式无主键表迁移至 OceanBase 数据库,会转化为无主键非分区表。如果需要分区,请手动指定主键和分区键。

    全量迁移

    执行数据迁移前,请评估源端和目标端的性能,建议业务低峰期执行数据迁移。否则全量迁移期间,数据传输占用源端和目标端一定的读写资源,可能会导致数据库的负载上升。性能评估详情请参见 迁移评估的性能评估

    全量迁移任务开始后,数据传输会迁移源库表的存量数据至目标端数据库对应的表中。

    增量同步

    增量同步任务开始后,数据传输会同步源库发生变化的数据(新增、修改或删除)至目标端数据库对应的表中。

    增量同步 支持的同步 DML 包括 InsertDeleteUpdate,您可以根据需求进行选择。详情请参见 DML 过滤

    全量校验

    在全量迁移完成、增量数据同步至目标端并与源端基本追平后,数据传输会自动发起一轮针对源库配置的数据表和目标表的全量数据校验任务。

    • 如果您选择了 增量同步,且 同步 DML 选项中未选择所有的 DML,则数据传输不支持本场景下的全量数据校验。

    • 执行数据迁移前,请评估源端和目标端的性能,建议业务低峰期执行数据迁移。否则全量校验期间,数据传输占用源端和目标端部分读资源,可能会导致数据库的负载上升。

    反向增量

    反向增量任务开始后,可以实时回流业务切换后在目标端数据库产生的变更数据至源端数据库。

    说明

    该功能限时免费,收费时会提前通知您。

  6. 单击 下一步。在 选择迁移对象 页面,选择迁移对象。

    您可以通过 指定对象匹配规则 两个入口选择迁移对象。

    重要
    • 待迁移的表名和其中的列名不能包含中文字符。

    • 当数据库的库名或表名存在“$$”字符时,会影响数据迁移项目的创建。

    • 选择 指定对象,在左侧选中需要迁移的对象,单击 >,将其添加至右侧列表中。您可以选择一个或多个库的表、视图作为迁移对象。

      数据传输支持通过文本导入对象,并支持对目标端对象进行重命名、设置行过滤、查看列信息,以及移除单个或全部迁移对象等操作。

      操作

      步骤

      导入对象

      1. 在选择区域的右侧列表中,单击右上角的 导入对象

      2. 在对话框中,单击 确定

        重要

        导入会覆盖之前的操作选择,请谨慎操作。

      3. 导入迁移对象 对话框中,导入需要迁移的对象。

        您可以通过导入 CSV 文件的方式进行库表重命名、设置行过滤条件等操作。详情请参见 下载和导入迁移对象配置

      4. 单击 检验合法性

        完成迁移对象导入后,请先检验合法性。目前暂不支持列字段映射。

      5. 通过检验后,单击 确定

      重命名

      数据传输支持重命名迁移对象的名称,详情请参见 数据库库表重命名

      设置

      数据传输支持 where 条件实现行过滤,详情请参见 SQL 条件过滤数据

      您还可以在 查看列 区域,查看迁移对象的列信息。

      移除/全部移除

      数据传输支持在数据映射时,对暂时选中到目标端的单个或多个对象进行移除操作。

      • 移除单个迁移对象

        在选择区域的右侧列表中,鼠标悬停至目标对象,单击显示的 移除,即可移除该迁移对象。

      • 移除全部迁移对象

        在选择区域的右侧列表中,单击右上角的 全部移除。在对话框中,单击 确定,即可移除全部迁移对象。

    • 选择 匹配规则,详情请参见 配置迁移对象的匹配规则

  7. 单击 下一步。在 迁移选项 页面,配置各项参数。

    参数

    描述

    实例规格

    展示所选传输实例的规格,不支持修改。

    目标端表对象存在记录时处理策略

    选择迁移类型 页面,选中 全量迁移,才会显示该参数。处理策略包括 忽略停止迁移

    • 选择 忽略,可能导致源端和目标端的数据不一致。

    • 选择 停止迁移,当系统检测到目标端表对象存在记录时,该项目将被置为失败状态。如果您需要继续进行数据迁移,请手动恢复该项目。

    是否允许索引后置

    您可以设置是否允许全量数据迁移完成后再创建索引,索引后置功能能够缩短全量迁移耗时。选择索引后置的注意事项,请参见表格下方的说明。

    重要
    • 选择迁移类型 页面同时选中 结构迁移 全量迁移,才会显示该参数。

    • 仅非唯一键索引支持后置创建。

    • OceanBase 数据库 1.x 版本不支持索引后置功能。

    • 执行索引时,如果目标端 OceanBase 数据库 MySQL 租户遇到 Duplicate key name 报错,数据传输会进行忽略,默认为索引创建成功,不会再重复创建。

    允许索引后置的情况下,建议您根据目标端 OceanBase 数据库的硬件条件和当前业务流量情况,自行调节参数。

    • 如果您使用的是 OceanBase 数据库 4.x 版本,请通过黑屏客户端工具调整以下 sys 租户参数和业务租户参数。

      • 调整 sys 租户参数

        // parallel_servers_target 用于设置每个 Server 上的并行查询排队条件。
        // 如果完全为了性能,建议您将该参数调整为大于物理 CPU 的值,例如 1.5 倍。同时设置的值不超过 64,避免产生 OceanBase 数据库内核抢锁问题。
        set global parallel_servers_target = 64; 
      • 调整业务租户参数

        // 文件内存缓冲区限制
        alter system set _temporary_file_io_area_size = '10' tenant = 'xxx'; 
        // 4.x 关闭限流
        alter system set sys_bkgd_net_percentage = 100;  
    • 如果您使用的是 OceanBase 数据库 2.x 或 3.x 版本,请通过黑屏客户端工具调整以下 sys 租户参数。

      // parallel_servers_target 用于设置每个 Server 上的并行查询排队条件。
      // 如果完全为了性能,建议您将该参数调整为大于物理 CPU 的值,例如 1.5 倍。同时设置的值不超过 64,避免产生 OceanBase 数据库内核抢锁问题。
      set global parallel_servers_target = 64; 
      // data_copy_concurrency 用于设置系统中并发执行的数据迁移复制任务的最大并发数。
      alter system set data_copy_concurrency = 200; 
  8. 单击 预检查,系统对数据迁移项目进行预检查。

    预检查 环节,数据传输会检查数据库用户的读写权限、数据库的网络连接等是否符合要求。全部检查项目均通过后才能启动数据迁移项目。如果预检查报错:

    • 您可以在排查并处理问题后,重新执行预检查,直至预检查成功。

    • 您也可以单击错误预检查项操作列中的 跳过,会弹出对话框提示您跳过本操作的具体影响,确认可以跳过后,请单击对话框中的 确定

  9. 预检查成功后,单击 启动项目

    如果您暂时无需启动项目,请单击 保存。后续您只能在 迁移项目列表 页面手动启动项目或通过批量操作启动项目。批量操作的详情请参见 批量操作数据迁移项目

    数据传输支持在数据迁移项目运行过程中修改迁移对象,详情请参见 查看和修改迁移对象。数据迁移项目启动后,会根据选择的迁移类型依次执行,详情请参见 查看迁移详情

相关文档

阿里云首页 云数据库 OceanBase 相关技术圈