迁移 AnalyticDB MySQL 的数据至 OceanBase 数据库 MySQL 租户

本文为您介绍如何迁移云原生数据仓库 AnalyticDB MySQL 版的数据至 OceanBase 数据库 MySQL 租户。

重要

如果数据迁移任务长期处于非活跃状态(任务状态为 失败已暂停已完成),受增量日志保留时长等影响,任务可能无法恢复。数据传输将主动释放处于非活跃状态超过 3 天的数据迁移任务,以回收相关资源,建议您为任务配置告警并及时处理任务相关异常。

背景信息

  • AnalyticDB MySQL 版的基本介绍请参见 基础数据类型

  • AnalyticDB MySQL 版的建表、分区表和分布表的详情请参见 CREATE TABLE

前提条件

  • 数据传输已具备云资源访问权限。详情请参见 数据传输迁移角色授权

  • 已为源端 AnalyticDB MySQL 版创建专用于数据迁移任务的账号。详情请参见 ADB 数据源

  • 已为目标端 OceanBase 数据库 Oracle 租户创建专用于数据迁移任务的数据库用户,并为其赋予了相关权限。详情请参见 创建数据库用户

使用限制

  • 源端数据库的操作限制

    请勿在全量迁移阶段执行库或表结构变更的 DDL 操作,否则可能造成数据迁移任务中断。

  • 目前支持的 AnalyticDB MySQL 版本为 V3.0。

  • 目标端是数据库的情况下,数据传输不支持目标端存在触发器(Trigger)。如果存在触发器,可能导致数据迁移失败。

  • 数据传输仅支持迁移库名、表名和列名为 ASCII 码且不包含特殊字符(包括换行、空格,以及 .|"'`()=;/&\)的对象。

  • 数据传输暂不支持全量校验。请在全量迁移完成后自行确认数据的正确性,避免在迁移过程中丢失数据。

注意事项

  • 如果源端字符集为 UTF-8,建议目标端使用兼容源端的字符集(例如,UTF-8、UTF-16 等),避免因字符集不兼容导致目标端出现乱码等问题。

  • 请确认数据传输对 DECIMAL、FLOAT 或 DOUBLE 等列类型的迁移精度是否符合预期。如果目标端字段类型的精度小于源端字段类型的精度,则可能发生截断现象,导致源端和目标端的数据不一致。

  • 如果您变更目标端的唯一索引,需要重启数据迁移任务,否则可能存在数据不一致的问题。

  • 如果源端或目标端存在仅大小写不同的表对象,可能会因为源端或目标端大小写不敏感导致数据迁移的结果不符合预期。

数据类型映射

AnalyticDB MySQL V3.0

AnalyticDB MySQL 说明

OceanBase 数据库 MySQL 租户

BOOLEAN

值只能是 0 或 1,存储字节数为 1 比特位。

  • 取值为 0,表示 false。

  • 取值为 1,表示 true。

BOOLEAN

TINYINT

取值范围为 -128~127,存储字节数为 1 字节。

TINYINT

SMALLINT

取值范围为 -32768~32767,存储字节数为 2 字节。

SMALLINT

INT 或 INTEGER

取值范围为 -2147483648~2147483647,存储字节数为 4 字节。

INT 或 INTEGER

BIGINT

取值范围为 -9223372036854775808~9223372036854775807,存储字节数为 8 字节。

BIGINT

FLOAT

取值范围为 -3.402823466E+38~-1.175494351E-38, 0, 1.175494351E-38~3.402823466E+38,IEEE 标准,存储字节数为 4 字节。

FLOAT

DOUBLE

取值范围为 -1.7976931348623157E+308~-2.2250738585072014E-308, 0, 2.2250738585072014E-308~1.7976931348623157E+308,IEEE 标准,存储字节数为 8 字节。

DOUBLE

DECIMAL(m,d) 或 NUMERIC

m 是数值的最大精度,取值范围为 1~1000;d 是小数点右侧数字的位数,要求 d≤m。

DECIMAL(m,d)

VARCHAR(n)

有存储字节数最大为 16MB,使用时无需指定存储长度。

非主键列与索引列:VARCHAR(4094)

主键列与索引列:MEDIUMTEXT

BINARY(n)

非主键列与索引列:VARBINARY(4094)

主键列与索引列:MEDIUMBLOB

DATE

取值范围为 '0001-01-01'~'9999-12-31',支持的数据格式为 'YYYY-MM-DD',存储字节数为 4 字节。

DATE

TIME

取值范围为 '00:00:00'~'23:59:59',支持的数据格式为 'HH:MM:SS',存储字节数为 8 字节。

TIME(3)

DATETIME

取值范围为 '0001-01-01 00:00:00.000'UTC~'9999-12-31 23:59:59.999'UTC,支持的数据格式为 'YYYY-MM-DD HH:MM:SS',存储字节数为 8 字节。

DATETIME(3)

TIMESTAMP

时间戳类型,取值范围为 '0100-01-01 00:00:00.000'UTC~'9999-12-31 23:59:59.999'UTC,支持的数据格式为 'YYYY-MM-DD HH:MM:SS',存储字节数为 8 字节。

TIMESTAMP(3)

POINT

地理坐标,由坐标经度 X 和纬度 Y 组成。

POINT

JSON

JSON

支持的源端和目标端实例类型

下表中,OceanBase 数据库 MySQL 租户简称为 OB_MySQL。

源端

目标端

AnalyticDB MySQL

OB_Oracle(OceanBase 集群实例)

AnalyticDB MySQL

OB_Oracle(VPC 内自建数据库)

操作步骤

  1. 登录 OceanBase 管理控制台,购买数据迁移任务。

    详情请参见 购买数据迁移任务

  2. 数据传输 > 数据迁移 页面,单击新购买的数据迁移任务后的 配置

    image.png

    如果您需要引用已有的任务配置信息,可以单击 引用配置。详情请参见 引用数据迁移任务配置

  3. 选择源和目标 页面,配置各项参数。

    参数

    描述

    迁移任务名称

    建议使用中文、数字和字母的组合。名称中不能包含空格,长度不能超过 64 个字符。

    源端

    如果您已新建 ADB 数据源,请从下拉列表中进行选择。如果未新建,请单击下拉列表中的 新建数据源,在右侧对话框进行新建。参数详情请参见 新建 ADB 数据源

    目标端

    如果您已新建 OceanBase 数据库 MySQL 租户数据源,请从下拉列表中进行选择。如果未新建,请单击下拉列表中的 新建数据源,在右侧对话框进行新建。参数详情请参见 新建 OceanBase 数据源

    标签(可选)

    单击文本框,在下拉列表中选择目标标签。您也可以单击 管理标签 进行新建、修改和删除。详情请参见 通过标签管理数据迁移任务

  4. 单击 下一步。在 选择迁移类型 页面,选择 全量迁移

    全量迁移任务开始后,数据传输会将源端库表的存量数据迁移至目标端数据库对应的表中。目前迁移类型仅支持全量迁移。

    image

  5. 单击 下一步。在 选择迁移对象 页面,选择当前数据迁移任务的迁移对象。

    您可以通过 指定对象匹配规则 两个入口选择迁移对象。本文为您介绍通过 指定对象 方式选择迁移对象的具体操作,配置匹配规则的详情请参见 配置匹配规则

    重要
    • 待迁移的表名和其中的列名不能包含中文字符。

    • 当数据库的库名或表名存在“$$”字符时,会影响数据迁移任务的创建。

    image.png

    1. 选择迁移对象 区域,选中 指定对象

    2. 选择迁移范围 区域的 源端对象 列表选中需要迁移的对象。您可以选择一个或多个库的表、视图作为迁移对象。

    3. 单击 >,将其添加至 目标端对象 列表中。

    数据传输支持通过文本导入对象,并支持对目标端对象进行重命名、设置行过滤、查看列信息,以及移除单个或全部迁移对象等操作。

    说明

    通过 匹配规则 方式选择迁移对象时,重命名能力由匹配规则语法覆盖,操作处仅支持设置过滤条件。详情请参见 配置匹配规则

    操作

    步骤

    导入对象

    1. 在选择区域的右侧列表中,单击右上角的 导入对象

    2. 在对话框中,单击 确定

      重要

      导入会覆盖之前的操作选择,请谨慎操作。

    3. 导入迁移对象 对话框中,导入需要迁移的对象。

      您可以通过导入 CSV 文件的方式进行库表重命名、设置行过滤条件等操作。详情请参见 下载和导入迁移对象配置

    4. 单击 检验合法性

      完成迁移对象导入后,请先检验合法性。目前暂不支持列字段映射。

    5. 通过检验后,单击 确定

    重命名

    数据传输支持重命名迁移对象的名称,详情请参见 数据库库表重命名

    设置

    数据传输支持 WHERE 条件实现行过滤,详情请参见 SQL 条件过滤数据

    您还可以在 查看列 区域,查看迁移对象的列信息。

    移除/全部移除

    数据传输支持在数据映射时,对暂时选中到目标端的单个或多个对象进行移除操作。

    • 移除单个迁移对象

      在选择区域的右侧列表中,鼠标悬停至目标对象,单击显示的 移除,即可移除该迁移对象。

    • 移除全部迁移对象

      在选择区域的右侧列表中,单击右上角的 全部移除。在对话框中,单击 确定,即可移除全部迁移对象。

  6. 单击 下一步。在 迁移选项 页面,配置全量迁移的各项参数。

    image

    参数

    描述

    读取并发配置

    该参数用于配置全量迁移阶段从源端读取数据的并发数,最大限制为 512。并发数过高可能会造成源端压力过大,影响业务。

    写入并发配置

    该参数用于配置全量迁移阶段往目标端写入数据的并发数,最大限制为 512。并发数过高可能会造成目标端压力过大,影响业务。

    全量迁移速率限制

    您可以根据实际需求决定是否开启全量迁移速率限制。如果开启,请设置 RPS(全量迁移阶段每秒最多可以迁移至目标端的数据行数的最大值限制)和 BPS(全量迁移阶段每秒最多可以迁移至目标端的数据量的最大值限制)。

    说明

    此处设置的 RPS 和 BPS 仅作为限速限流能力,全量迁移实际可以达到的性能受限于源端、目标端、实例规格配置等因素的影响。

    目标端表对象存在记录时处理策略

    处理策略包括 忽略停止迁移

    • 选择 忽略:当目标端表对象存在数据时,如果原数据与写入数据冲突,数据传输采用将冲突数据记录日志,保留原数据不变的策略进行数据写入。

      重要

      选择 忽略,全量校验将使用 IN 模式拉取数据,无法校验目标端存在源端没有的数据的场景,并且校验性能会有一定程度降级。

    • 选择默认值 停止迁移:当目标端表对象存在数据时,全量迁移会报错不允许迁移,请处理好目标端数据后再继续迁移。

      重要

      如果出错后单击恢复,数据传输将忽略该配置选项,继续迁移表数据,请谨慎操作。

  7. 单击 预检查,系统对数据迁移任务进行预检查。

    预检查 环节,数据传输会检查数据库用户的读写权限、数据库的网络连接等是否符合要求。全部检查任务均通过后才能启动数据迁移任务。如果预检查报错:

    • 您可以在排查并处理问题后,重新执行预检查,直至预检查成功。

    • 您也可以单击错误预检查项操作列中的 跳过,会弹出对话框提示您跳过本操作的具体影响,确认可以跳过后,请单击对话框中的 确定

  8. 预检查成功后,单击 启动任务

    如果您暂时无需启动任务,请单击 保存。后续您只能在 迁移任务列表 页面手动启动任务或通过批量操作启动任务。批量操作的详情请参见 批量操作数据迁移任务

    数据传输支持在数据迁移任务运行过程中修改迁移对象及其行过滤条件,详情请参见 查看和修改迁移对象及其过滤条件。数据迁移任务启动后,会根据所选择的迁移类型依次执行,详情请参见 查看迁移详情

相关文档