首页 云数据库 OceanBase 操作指南 数据传输 数据迁移 迁移 Oracle 数据库的数据至 OceanBase 数据库 Oracle 租户

迁移 Oracle 数据库的数据至 OceanBase 数据库 Oracle 租户

更新时间: 2023-11-29 10:09:30

Oracle 数据库包括 VPC 内自建数据库、通过数据库网关接入的自建数据库和公网 IP 自建数据库。本文为您介绍如何迁移 Oracle 数据库的数据至 OceanBase 数据库 Oracle 租户。

重要

如果数据迁移项目长期处于非活跃状态(项目状态为 失败已暂停已完成),受增量日志保留时长等影响,项目可能无法恢复。数据传输将主动释放处于非活跃状态超过 7 天的数据迁移项目,以回收相关资源,建议您为项目配置告警并及时处理项目相关异常。

前提条件

  • 已购买传输实例。详情请参见 购买传输实例

  • 已为源端 Oracle 数据库和目标端 OceanBase 数据库 Oracle 租户创建专用于数据迁移的数据库用户,并赋予其相关权限。详情请参见 创建数据库用户

  • 已在目标端 OceanBase 数据库 Oracle 租户创建对应的数据库。OceanBase 数据迁移功能支持迁移表和列,不支持迁移库,您需要提前在目标端创建对应的数据库。

  • 如果源端为通过数据库网关接入的 Oracle 数据库,请确保已通过数据库网关接入阿里云,详情请参见 快速入门

使用限制

  • 源端数据库的操作限制

    请勿在结构迁移和全量迁移阶段执行库或表结构变更的 DDL 操作,否则可能造成数据迁移项目中断。

  • 数据传输支持的 Oracle 数据库版本为 10G/11G/12C/18C/19C,12C 及以上版本包含数据库容器(Container Database,CDB)和可插拔数据库(Pluggable Database,PDB)。

  • 数据传输仅支持迁移普通表和视图。

  • 数据传输仅支持迁移库名、表名和列名为 ASCII 码且不包含特殊字符(包括换行、空格,以及 .|"'`()=;/&)的对象。

  • 目标端是数据库的情况下,数据传输不支持目标端存在 Trigger。如果存在,可能导致数据迁移失败。

  • 数据源标识和用户账号等,在数据传输系统内全局唯一。

  • Oracle 数据库的增量日志解析最大支持 5T/天。

  • 自建数据库所在的 VPC 必须和 OceanBase 数据库位于同一个地域。

  • Oracle 数据库 11G 及以下版本不支持创建超过 30 个字节的数据库对象。在反向增量步骤中,请注意不能在 OceanBase 数据库 Oracle 租户中创建大于本限制的数据库对象。

  • 数据传输不支持迁移 Oracle 数据库 12C 及以上版本中超过 30 个字节的数据库对象(包括 Schema、表和列等)。如果您需要迁移超过 30 个字节的数据库对象,请联系技术支持人员。

  • 数据传输不支持源端 Oracle 数据库执行某些 UPDATE 命令。以下示例为一个不支持的 UPDATE 命令。

     UPDATE TABLE_NAME SET KEY=KEY+1;

    上述示例中,TABLE_NAME 是表名,KEY 是定义为主键的 NUMERIC 类型的列。

  • 数据类型的限制

    • 不支持表中全部列均为 LOB 类型(BLOB/CLOB/NCLOB)的增量数据同步。

    • 对于无主键且包含 LOB 类型字段的表,反向增量会出现数据质量问题。

注意事项

  • 当需要进行 Oracle 数据库的增量同步时,Oracle 数据库单个归档文件的大小建议小于 2GB。

  • Oracle 数据库的归档文件保存 2 天以上,否则由于某个时间段归档量陡增等情况,准备恢复时没有了归档文件,将无法恢复。

  • 如果源端 Oracle 数据库存在交换主键的 DML 语句,将导致数据传输解析日志异常,迁移至目标端时存在数据丢失的问题。交换主键的 DML 语句示例如下:

    update test set c1=(case when c1=1 then 2 when c1=2 then 1 end) where c1 in (1,2);
  • Oracle 实例的字符集配置可以为 AL32UTF8、AL16UTF16、ZHS16GBK 和 GB18030。

    如果源端字符集为 UTF-8,建议目标端使用兼容源端的字符集(例如,UTF-8、UTF-16 等),避免产生因字符集不兼容导致目标端出现乱码等问题。

  • 迁移 Oracle 数据库的无主键表至 OceanBase 数据库 Oracle 租户时,禁止所有表进行导入、导出、Alter Table、FlashBack Table、分区分裂或合并等会导致 ROWID 变更的操作。

  • 节点之间的时钟不同步,或者电脑终端和服务器之间的时钟不同步,均可能导致延迟时间(增量同步/反向增量)不准确。

    例如,如果时钟早于标准时间,可能导致延迟时间为负数。如果时钟晚于标准时间,可能导致延迟。

  • 由于中国曾经实行夏令时的历史原因,导致 Oracle 数据库至 OceanBase 数据库 Oracle 租户的增量同步中,1986 年~1991 年的夏令时开始和结束的日期,以及 1988 年 4 月 10 日~ 4 月 17 日,TIMESTAMP(6) WITH TIME ZONE类型,源端和目标端可能存在 1 小时的时间差。

  • 目标端 OceanBase 数据库 Oracle 租户的版本小于 2.2.70 时,切换流程补充外键、Check 等对象有不兼容的风险。

  • 在未开启同步 DDL 的情况下,如果您变更目标端的唯一索引,需要重启数据迁移项目,否则可能存在数据不一致的问题。

  • 如果数据迁移项目未启用正向切换,请删除目标端数据库对应的唯一索引和伪列。如果不删除唯一索引和伪列,会导致无法写入数据,以及往下游导入数据时,会重新生成伪列,导致与源端数据库的伪列发生冲突。

    如果数据迁移项目已启用正向切换,数据传输会根据数据迁移项目的类型,自动删除隐藏列和唯一索引。详情请参见 数据迁移服务隐藏列机制说明

  • 对于 Oracle 数据库至 OceanBase 数据库 Oracle 租户的增量同步,如果有新增的无主键表迁移,数据传输不会自动删除在 OceanBase 数据库 Oracle 租户目标端添加的隐藏列和唯一索引。在进行反向迁移前,请您手动删除。

    您可以查看logs/msg/manual_table.log文件,确认增量同步阶段添加的无主键表。

  • 通过配置匹配规则的方式选择 CTAS 语句创建的表作为迁移对象时,建议您提前设置特定的规则(例如,a.*_2023_backup)来避免出现数据迁移项目中断的情况。

  • 当源端和目标端的字符编码配置不同时,结构迁移会提供字段长度定义扩大的策略。例如,字段长度 1.5 倍扩大,长度单位从 BYTE 转为 CHAR 等。

    转换后可以确保源端不同字符集中的数据能成功迁移至目标端,但割接后反向增量可能会出现数据超长无法写回源端的问题。

  • 多表汇聚场景下:

    • 建议您使用导入对象和匹配规则的方式映射源端和目标端的关系。

    • 建议您自行在目标端创建表结构。如果使用数据传输创建,请在结构迁移步骤跳过部分失败对象。

  • 请检查 Oracle 数据库回收站内的对象。当对象大于 100 时,容易造成内部表查询超时,请进行回收站的对象清理工作。

    • 检查回收站是否打开。

      SELECT Value FROM V$parameter WHERE Name = 'recyclebin';
    • 检查回收站内对象的数量。

      SELECT COUNT(*) FROM RECYCLEBIN;

支持的源端和目标端实例类型

下表中,OceanBase 数据库 Oracle 租户简称为 OB_Oracle。

源端

目标端

Oracle(VPC 内自建数据库)

OB_Oracle(OceanBase 集群实例)

Oracle(数据库网关)

OB_Oracle(OceanBase 集群实例)

Oracle(公网 IP 自建数据库)

OB_Oracle(OceanBase 集群实例)

数据类型映射

重要
  • CLOB 和 BLOB 类型的数据必须小于 48 MB。

  • 不支持迁移 ROWID、BFILE、XMLType、UROWID、UNDEFINED 和 UDT 类型的数据。

  • 不支持 LONG 或 LONG RAW 类型的表进行增量同步。

Oracle 数据库

OceanBase 数据库 Oracle 租户

CHAR(n CHAR)

CHAR(n CHAR)

CHAR(n BYTE)

CHAR(n BYTE)

NCHAR(n)

NCHAR(n)

VARCHAR2(n)

VARCHAR2(n)

NVARCHAR2(n)

NVARCHAR2(n)

NUMBER(n)

NUMBER(n)

NUMBER (p, s)

NUMBER(p,s)

RAW

RAW

CLOB

CLOB

NCLOB

  • OceanBase 数据库 2.2.50 以下版本不支持转换

  • OceanBase 数据库 2.2.50 及以上版本支持转换为 NVARCHAR2

    说明

    OceanBase 数据库 Oracle 租户中,NVARCHAR2 类型的字段不支持空值。如果源端存在空值,则以字符串 NULL 表示。

BLOB

BLOB

REAL

FLOAT

FLOAT(n)

  • OceanBase 数据库 2.2.30 以下版本:NUMBER(n\*0.30103)

  • OceanBase 数据库 2.2.30 及以上版本:FLOAT

BINARY_FLOAT

BINARY_FLOAT

BINARY_DOUBLE

BINARY_DOUBLE

DATE

DATE

TIMESTAMP

TIMESTAMP

TIMESTAMP WITH TIME ZONE

TIMESTAMP WITH TIME ZONE

TIMESTAMP WITH LOCAL TIME ZONE

TIMESTAMP WITH LOCAL TIME ZONE

INTERVAL YEAR(p) TO MONTH

INTERVAL YEAR(p) TO MONTH

INTERVAL DAY(p) TO SECOND

INTERVAL DAY(p) TO SECOND

LONG

CLOB

重要

该类型不支持增量同步。

LONG RAW

BLOB

重要

该类型不支持增量同步。

创建数据迁移项目

  1. 新建数据迁移项目。

    1. 登录 OceanBase 管理控制台

    2. 在左侧导航栏,单击 数据传输>数据迁移

    3. 数据迁移 页面,单击右上角的 新建迁移项目

  2. 选择源和目标 页面,配置各项参数。

    参数

    描述

    迁移项目名称

    建议使用中文、数字和字母的组合。名称中不能包含空格,长度不能超过 64 个字符。

    标签

    单击文本框,在下拉列表中选择目标标签。您也可以单击 管理标签,进行新建、修改和删除。详情请参见 通过标签管理数据迁移项目

    源端

    如果您已新建 Oracle 数据源,请从下拉列表中进行选择。如果未新建,请单击下拉列表中的 新建数据源,在右侧对话框进行新建。参数详情请参见 新建 Oracle 数据源

    目标端

    如果您已新建 OceanBase 数据库 Oracle 租户数据源,请从下拉列表中进行选择。如果未新建,请单击下拉列表中的 新建数据源,在右侧对话框进行新建。参数详情请参见 新建 OceanBase 数据源

    重要

    目标端仅支持 OceanBase 数据库 Oracle 租户的 实例类型OceanBase 集群实例

    传输实例

    从下拉列表中选择已购买的传输实例。如果您未购买,请单击右侧的 购买 进行操作。详情请参见 购买传输实例

  3. 单击 下一步。在 选择迁移类型 页面,选择当前迁移项目的迁移类型。

    迁移类型 包括 结构迁移全量迁移增量同步全量校验 反向增量

    迁移类型

    描述

    结构迁移

    结构迁移任务开始后,数据传输会迁移源库中的数据对象定义(表、索引、约束、注释和视图等)至目标端数据库中,并自动过滤临时表。

    全量迁移

    全量迁移任务开始后,数据传输会迁移源库表的存量数据至目标端数据库对应的表中。如果选择 全量迁移,建议您在迁移数据前,使用 GATHER_SCHEMA_STATSGATHER_TABLE_STATS 语句收集 Oracle 数据库的统计信息。

    增量同步

    增量同步任务开始后,数据传输会同步源库发生变化的数据(新增、修改或删除)至目标端数据库对应的表中。

    增量同步 包括 同步 DML同步 DDL,您可以根据需求进行选择。同步 DDL 的详情请参见 Oracle 数据库至 OceanBase 数据库 Oracle 租户的同步 DDL增量同步 的使用限制如下:

    • 多表到单表的汇集场景,均不支持同步 DDL。

    • 如果您选择了 同步 DDL,当源端数据库发生数据传输未支持的同步 DDL 操作时,会存在数据迁移中断的风险。

    • 如果 DDL 操作为新增列,建议您设置该列的属性为 Null,否则会存在数据迁移中断的风险。

    全量校验

    在全量迁移完成、增量数据同步至目标端并与源端基本追平后,数据传输会自动发起一轮针对源库配置的数据表和目标表的全量数据校验任务。

    • 如果选择 全量校验,建议您在全量校验开始前,分别收集 Oracle 数据库和 OceanBase 数据库 Oracle 租户的统计信息。

    • 如果您选择了 增量同步,且 同步 DML 选项中未选择所有的 DML,则数据传输不支持本场景下的全量数据校验。

    反向增量

    反向增量任务开始后,可以实时回流业务切换后在目标端数据库产生的变更数据至源端数据库。

    说明

    该功能限时免费,收费时会提前通知您。

  4. 单击 下一步。在 选择迁移对象 页面,选择迁移对象。

    您可以通过 指定对象匹配规则 两个入口选择迁移对象。

    重要
    • 待迁移的表名和其中的列名不能包含中文字符。

    • 当数据库的库名或表名存在“$$”字符时,会影响数据迁移项目的创建。

    • 通过 指定对象 的方式选择迁移对象后,DDL 操作仅对已选择的对象生效,不支持创建新表。

    • 选择 指定对象,在左侧选中需要迁移的对象,单击 >,将其添加至右侧列表中。您可以选择一个或多个库的表、视图作为迁移对象。

      数据传输支持通过文本导入对象,并支持对目标端对象进行重命名、设置行过滤、查看列信息,以及移除单个或全部迁移对象等操作。

      操作

      步骤

      导入对象

      1. 在选择区域的右侧列表中,单击右上角的 导入对象

      2. 在对话框中,单击 确定

        重要

        导入会覆盖之前的操作选择,请谨慎操作。

      3. 导入迁移对象 对话框中,导入需要迁移的对象。

        您可以通过导入 CSV 文件的方式进行库表重命名、设置行过滤条件等操作。详情请参见 下载和导入迁移对象配置

      4. 单击 检验合法性

        完成迁移对象导入后,请先检验合法性。目前暂不支持列字段映射。

      5. 通过检验后,单击 确定

      重命名

      数据传输支持重命名迁移对象的名称,详情请参见 数据库库表重命名

      设置

      数据传输支持 where 条件实现行过滤,详情请参见 SQL 条件过滤数据

      您还可以在 查看列 区域,查看迁移对象的列信息。

      移除/全部移除

      数据传输支持在数据映射时,对暂时选中到目标端的单个或多个对象进行移除操作。

      • 移除单个迁移对象

        在选择区域的右侧列表中,鼠标悬停至目标对象,单击显示的 移除,即可移除该迁移对象。

      • 移除全部迁移对象

        在选择区域的右侧列表中,单击右上角的 全部移除。在对话框中,单击 确定,即可移除全部迁移对象。

    • 选择 匹配规则,详情请参见 配置迁移对象的匹配规则

  5. 单击 下一步。在 迁移选项 页面,配置各项参数。

    参数

    描述

    实例规格

    展示所选传输实例的规格,不支持修改。

    增量同步起始位点

    • 如果选择迁移类型时已选择 全量迁移,该参数不显示。

    • 如果选择迁移类型时未选择 全量迁移,但选择了 增量同步,请在此处指定迁移某个时间节点之后的数据,默认为当前系统时间。详情请参见 设置增量同步位点

    目标端表对象存在记录时处理策略

    选择迁移类型 页面,选中 全量迁移,才会显示该参数。处理策略包括 忽略停止迁移

    • 选择 忽略,可能导致源端和目标端的数据不一致。

    • 选择 停止迁移,当系统检测到目标端表对象存在记录时,该项目将被置为失败状态。如果您需要继续进行数据迁移,请手动恢复该项目。

    字符编码与长度定义选项

    已选择 结构迁移,且源端和目标端的字符集不一致时,才会显示该参数。

    说明
    • 源端和目标端的字符集不一致(例如,源端为 GBK,目标端为 UTF-8)时,可能会发生字段截断,数据不一致的情况。

    • 当您选择 自动放大目标端字段长度,即 N BYTE → 1.5N BYTE 时,如果转化后的长度超过最大长度限制,则转化后的长度为最大长度限制。

    是否允许索引后置

    您可以设置是否允许全量数据迁移完成后再创建索引,索引后置功能能够缩短全量迁移耗时。选择索引后置的注意事项,请参见表格下方的说明。

    重要
    • 选择迁移类型 页面同时选中 结构迁移 全量迁移,才会显示该参数。

    • 仅非唯一键索引支持后置创建。

    • OceanBase 数据库 1.x 版本不支持索引后置功能。

    • 执行索引时,如果目标端 OceanBase 数据库 Oracle 租户遇到 name is already used by an existing object 报错,数据传输会进行忽略,默认为索引创建成功,不会再重复创建。

    允许索引后置的情况下,建议您根据目标端 OceanBase 数据库的硬件条件和当前业务流量情况,自行调节参数。

    • 如果您使用的是 OceanBase 数据库 4.x 版本,请通过黑屏客户端工具调整以下 sys 租户参数和业务租户参数。

      • 调整 sys 租户参数

        // parallel_servers_target 用于设置每个 Server 上的并行查询排队条件。
        // 如果完全为了性能,建议您将该参数调整为大于物理 CPU 的值,例如 1.5 倍。同时设置的值不超过 64,避免产生 OceanBase 数据库内核抢锁问题。
        set global parallel_servers_target = 64; 
      • 调整业务租户参数

        // 文件内存缓冲区限制
        alter system set _temporary_file_io_area_size = '10' tenant = 'xxx'; 
        // 4.x 关闭限流
        alter system set sys_bkgd_net_percentage = 100;  
    • 如果您使用的是 OceanBase 数据库 2.x 或 3.x 版本,请通过黑屏客户端工具调整以下 sys 租户参数。

      // parallel_servers_target 用于设置每个 Server 上的并行查询排队条件。
      // 如果完全为了性能,建议您将该参数调整为大于物理 CPU 的值,例如 1.5 倍。同时设置的值不超过 64,避免产生 OceanBase 数据库内核抢锁问题。
      set global parallel_servers_target = 64; 
      // data_copy_concurrency 用于设置系统中并发执行的数据迁移复制任务的最大并发数。
      alter system set data_copy_concurrency = 200; 
  6. 单击 预检查,系统对数据迁移项目进行预检查。

    预检查 环节,数据传输会检查数据库用户的读写权限、数据库的网络连接等是否符合要求。全部检查项目均通过后才能启动数据迁移项目。如果预检查报错:

    • 您可以在排查并处理问题后,重新执行预检查,直至预检查成功。

    • 您也可以单击错误预检查项操作列中的 跳过,会弹出对话框提示您跳过本操作的具体影响,确认可以跳过后,请单击对话框中的 确定

  7. 预检查成功后,单击 启动项目

    如果您暂时无需启动项目,请单击 保存。后续您只能在 迁移项目列表 页面手动启动项目或通过批量操作启动项目。批量操作的详情请参见 批量操作数据迁移项目

    数据传输支持在数据迁移项目运行过程中修改迁移对象,详情请参见 查看和修改迁移对象。数据迁移项目启动后,会根据选择的迁移类型依次执行,详情请参见 查看迁移详情

相关文档

阿里云首页 云数据库 OceanBase 相关技术圈