使用数据传输迁移数据

您可以通过数据迁移功能实时迁移其他数据源的数据至 OceanBase 数据库,以及迁移 OceanBase 数据库的数据至其他数据源。本文以迁移 MySQL 数据库的数据至 OceanBase 数据库为例,介绍如何使用数据传输迁移数据。

前提条件

在迁移数据之前,您需要确认以下信息:

  • 数据传输已具备云资源访问权限。详情请参见 数据传输迁移角色授权

  • 您已创建源端和目标端的数据源。详情请参见 新建数据源 模块的内容。

  • 源数据库和目标数据库均可以连通网络。

  • 您已为源端 MySQL 数据库和目标端 OceanBase 数据库的 MySQL 租户创建专用于数据迁移的数据库用户,并赋予其相关权限。详情请参见 配置数据源用户权限 模块的文档。

  • 已开启 Binlog,详情请参见 管理本地日志(Binlog)

操作步骤

说明

本文以迁移 MySQL 数据库的数据至 OceanBase 数据库为例,更多详情请参见 数据迁移 模块的内容。

  1. 登录 OceanBase 管理控制台,购买数据迁移任务。

    详情请参见 购买数据迁移任务

  2. 数据传输 > 数据迁移 页面,单击新购买的数据迁移任务后的 配置

    image.png

    如果您需要引用已有的任务配置信息,可以单击 引用配置。详情请参见 引用数据迁移任务配置

  3. 选择源和目标 页面,配置各项参数。

    参数

    描述

    迁移任务名称

    建议使用中文、数字和字母的组合。名称中不能包含空格,长度不能超过 64 个字符。

    源端

    源端数据库的名称,本文中为 MySQL 数据库。如果您已新建 MySQL 数据源,则从下拉列表中进行选择。如果您未新建,则单击下拉列表中的 新建数据源,在右侧对话框进行新建。参数详情请参见 新建 MySQL 数据源

    目标端

    目标端数据库的名称,本文中为 OceanBase 数据库。如果您已新建 OceanBase 数据库的 MySQL 租户数据源,则从下拉列表中进行选择。如果未新建,则单击下拉列表中的 新建数据源,在右侧对话框进行新建。参数详情请参见 新建 OceanBase 数据源

    重要

    目标端不支持 OceanBase 数据库的 实例类型VPC 内自建数据库

    标签(可选)

    单击文本框,在下拉列表中选择目标标签。您也可以单击 管理标签 进行新建、修改和删除。详情请参见 通过标签管理数据迁移任务

  4. 单击 下一步。在 选择迁移类型 页面,选择 同步拓扑单向同步

    部分类型的数据迁移任务支持 单向同步双向同步。本文为您介绍单向同步的操作,支持双向同步的具体任务类型说明及操作请参见 配置双向同步任务

  5. 选择当前数据迁移任务的迁移类型。

    同步拓扑为单向同步时,支持的迁移类型包括 结构迁移全量迁移增量同步全量校验反向增量

    image

    迁移类型

    描述

    结构迁移

    结构迁移任务开始后,数据传输会将源库中的数据对象定义(表、索引、约束、注释和视图等)迁移到目标数据库中,并自动过滤临时表。

    MySQL 数据库至 OceanBase 数据库 MySQL 租户的结构迁移支持自动创建目标端不存在的库。

    全量迁移

    全量迁移任务开始后,数据传输会将源端库表的存量数据迁移至目标端数据库对应的表中。如果选择 全量迁移,建议您在迁移数据前,使用 ANALYZE 语句收集 MySQL 数据库的统计信息。

    增量同步

    增量同步任务开始后,数据传输会将源端数据库发生变化的数据(新增、修改或删除)同步至目标端数据库对应的表中。

    增量同步 包括 DML 同步DDL 同步,您可以根据需求进行自定义配置。详情请参见 自定义配置 DDL/DML增量同步 的使用限制如下:

    • 如果您选择了 DDL 同步,当源端数据库发生数据传输不支持的增量 DDL 操作时,会存在数据迁移中断的风险。

    • 如果 DDL 操作为新增列,建议您将该列的属性设置为 NULL,否则会存在数据迁移中断的风险。

    全量校验

    在全量迁移完成、增量数据同步至目标端并与源端基本追平后,数据传输会自动发起一轮针对源端数据库配置的数据表和目标表的全量数据校验任务。

    • 如果选择 全量校验,建议您在全量校验开始前,分别收集 MySQL 数据库和 OceanBase 数据库 MySQL 租户的统计信息。

    • 如果您选择了 增量同步,且 DML 同步 选项中未选择所有的 DML,则数据传输不支持本场景下的全量数据校验。

    • 数据传输仅支持对唯一键表(指具有主键或非空唯一键的表)进行全量数据校验。

    反向增量

    反向增量任务开始后,可以实时将业务切换后在目标端数据库产生的变更数据回流至源端数据库。

    通常反向增量会复用增量同步的配置,您也可以根据实际需求进行自定义配置。

  6. 单击 下一步。在 选择迁移对象 页面,选择当前数据迁移任务的迁移对象。

    您可以通过 指定对象匹配规则 选择迁移对象。

    • 选择 指定对象,在左侧选中需要迁移的对象,单击 >,将其添加至右侧列表中。您可以选择一个或多个库的表、视图作为迁移对象。数据传输支持通过文本导入对象,并支持对目标端对象进行重命名、设置行过滤、查看列信息,以及移除单个或全部迁移对象等操作。导入对象的操作如下:

      1. 在选择区域的右侧列表中,单击右上角的 导入对象

      2. 在对话框中,单击 确定

        重要

        导入会覆盖之前的操作选择,请谨慎操作。

      3. 导入迁移对象 对话框中,导入需要迁移的对象。

        您可以通过导入 CSV 文件的方式进行库表重命名、设置行过滤条件等操作。详情请参见 下载和导入迁移对象配置

      4. 单击 检验合法性

        完成迁移对象导入后,请先检验合法性。目前暂不支持列字段映射。

      5. 通过验证后,单击 确定

    • 选择 匹配规则,详情请参见 配置匹配规则

  7. 单击 下一步。在 迁移选项 页面,配置各项参数。

    • 全量迁移

      选择迁移类型 页面,选中 单向同步 > 全量迁移,才会显示下述参数。

      image

      参数

      描述

      读取并发配置

      该参数用于配置全量迁移阶段从源端读取数据的并发数,最大限制为 512 并发数过高可能会造成源端压力过大,影响业务。

      写入并发配置

      该参数用于配置全量迁移阶段往目标端写入数据的并发数,最大限制为 512。并发数过高可能会造成目标端压力过大,影响业务。

      全量迁移速率限制

      您可以根据实际需求决定是否开启全量迁移速率限制。如果开启,请设置 RPS(全量迁移阶段每秒最多可以迁移至目标端的数据行数的最大值限制)和 BPS(全量迁移阶段每秒最多可以迁移至目标端的数据量的最大值限制)。

      说明

      此处设置的 RPS 和 BPS 仅作为限速限流能力,全量迁移实际可以达到的性能受限于源端、目标端、实例规格配置等因素的影响。

      目标端表对象存在记录时处理策略

      处理策略包括 忽略停止迁移

      • 选择 忽略:当目标端表对象存在数据时,如果原数据与写入数据冲突,数据传输采用将冲突数据记录日志,保留原数据不变的策略进行数据写入。

        重要

        选择 忽略,全量校验将使用 IN 模式拉取数据,无法校验目标端存在源端没有的数据的场景,并且校验性能会有一定程度降级。

      • 选择默认值 停止迁移:当目标端表对象存在数据时,全量迁移会报错不允许迁移,请处理好目标端数据后再继续迁移。

        重要

        如果出错后单击恢复,数据传输将忽略该配置选项,继续迁移表数据,请谨慎操作。

      是否允许索引后置

      您可以设置是否允许全量数据迁移完成后再创建索引,索引后置功能能够缩短全量迁移耗时。选择索引后置的注意事项,请参见表格下方的说明。

      重要
      • 选择迁移类型 页面同时选中 结构迁移 全量迁移,才会显示该参数。

      • 仅非唯一键索引支持后置创建。

      • 执行索引时,如果目标端 OceanBase 数据库遇到下述报错,数据传输会进行忽略,默认索引创建成功,不会再重复创建。

        • OceanBase 数据库 MySQL 租户报错 Duplicate key name

        • OceanBase 数据库 Oracle 租户报错 name is already used by an existing object

      当目标端为 OceanBase 数据库,并且此处选择 允许 后,请进行下述配置:

      • 单条索引 DDL 并发配置:并行度越高,资源消耗越大,迁移速度越快。

      • 最大并发索引 DDL 数量配置:同一时刻,系统调用的后置索引 DDL 数量的最大值限制。

      允许索引后置的情况下,建议您根据 OceanBase 数据库的硬件条件和当前业务流量情况,通过黑屏客户端工具调整以下业务租户参数。

      // 文件内存缓冲区限制
      alter system set _temporary_file_io_area_size = '10' tenant = 'xxx'; 
      // V4.x 关闭限流
      alter system set sys_bkgd_net_percentage = 100;  
    • 增量同步

      选择迁移类型 页面,选中 单向同步 > 增量同步,才会显示下述参数。

      image

      参数

      描述

      写入并发配置

      该参数用于配置增量同步阶段往目标端写入数据的并发数,最大限制为 512。并发数过高可能会造成目标端压力过大,影响业务。

      增量同步速率限制

      您可以根据实际需求决定是否开启增量同步速率限制。如果开启,请设置 RPS(增量同步阶段每秒最多可以同步至目标端的数据行数的最大值限制)和 BPS(增量同步阶段每秒最多可以同步至目标端的数据量的最大值限制)。

      说明

      此处设置的 RPS 和 BPS 仅作为限速限流能力,增量同步实际可以达到的性能受限于源端、目标端、实例规格配置等因素的影响。

      增量同步起始位点

      • 如果选择迁移类型时已选择 全量迁移,则不显示该参数。

      • 如果选择迁移类型时未选择 全量迁移,但选择了 增量同步,请在此处指定迁移某个时间节点之后的数据,默认为当前系统时间。详情请参见 设置增量同步位点

    • 反向增量

      选择迁移类型 页面,选中 单向同步 > 反向增量,才会显示该区域的参数。反向增量的配置参数默认 复用增量同步配置

      image

      您也可以取消复用增量同步配置,根据实际需求进行配置。

      参数

      描述

      写入并发配置

      该参数用于配置反向增量阶段往源端写入数据的并发数,最大限制为 512。并发数过高可能会造成源端压力过大,影响业务。

      反向增量速率限制

      您可以根据实际需求决定是否开启反向增量速率限制。如果开启,请设置 RPS(反向增量同步阶段每秒最多可以同步至源端的数据行数的最大值限制)和 BPS(反向增量同步阶段每秒最多可以同步至源端的数据量的最大值限制)。

      说明

      此处设置的 RPS 和 BPS 仅作为限速限流能力,反向增量同步实际可以达到的性能受限于源端、目标端、实例规格配置等因素的影响。

      增量同步起始位点

      • 如果选择迁移类型时已选择 全量迁移,则不显示该参数。

      • 如果选择迁移类型时未选择 全量迁移,但选择了 增量同步,则默认以正向切换(如有)为准,不支持修改。

    • 高级选项

      当目标端 OceanBase 数据库 MySQL 租户为 V4.3.0 及之后版本,并且在 选择迁移类型 页面,选中 结构迁移增量同步 > DDL 同步,才会显示该区域的参数。

      image

      目标端表对象存储类型包括 默认行存列存行列混存,该配置用于确定结构迁移或增量同步时目标端表对象的存储类型,详情请参见 default_table_store_format

      说明

      默认 选项是根据目标端参数配置自适应其他选项,是结构迁移的表对象或增量 DDL 的新增表对象根据设置的存储类型写入对应的结构。

  8. 单击 预检查,系统对数据迁移任务进行预检查。

    预检查 环节,数据传输会检查数据库用户的读写权限、数据库的网络连接等是否符合要求。全部检查任务均通过后才能启动数据迁移任务。如果预检查报错:

    • 您可以在排查并处理问题后,重新执行预检查,直至预检查成功。

    • 您也可以单击错误预检查项操作列中的 跳过,会弹出对话框提示您跳过本操作的具体影响,确认可以跳过后,请单击对话框中的 确定

  9. 预检查成功后,单击 启动任务

    如果您暂时无需启动任务,请单击 保存。后续您只能在 迁移任务列表 页面手动启动任务或通过批量操作启动任务。批量操作的详情请参见 批量操作数据迁移任务

    数据传输支持在数据迁移任务运行过程中修改迁移对象及其行过滤条件,详情请参见 查看和修改迁移对象及其过滤条件。数据迁移任务启动后,会根据所选择的迁移类型依次执行,详情请参见 查看迁移详情

相关文档