本文介绍如何使用数据传输服务DTS(Data Transmission Service),将MongoDB副本集实例迁移至分片集群实例。DTS支持全量数据迁移和增量数据迁移,同时使用这两种迁移类型可以实现在不停服的情况下,平滑地完成数据库的迁移。

前提条件

确保目标分片集群实例中的Shard节点具备充足的存储空间。

注意事项

  • DTS在执行全量数据迁移时将占用源库和目标库一定的资源,可能会导致数据库服务器负载上升。如果数据库业务量较大或服务器规格较低,可能会加重数据库压力,甚至导致数据库服务不可用。建议您在执行数据迁移前谨慎评估,在业务低峰期执行数据迁移。
  • MongoDB实例支持的版本与存储引擎请参见版本及存储引擎,如需跨版本或跨引擎迁移,请提前确认兼容性。
  • 由于DTS写入数据的逻辑为并发写入,所以会导致目标端占用的存储空间比源端大5%~10%。
  • 请确保目标端MongoDB没有与源端相同的主键(默认为_id),否则会导致数据丢失。若目标端有与源端相同的主键,请在不影响业务的前提条件下清空目标端的相关数据(删掉目标端中与源端相同_id的文档)。

费用说明

迁移类型链路配置费用公网流量费用
全量数据迁移不收费。仅当通过公网将数据迁移出阿里云时收费,详情请参见DTS产品定价
增量数据迁移收费,详情请参见DTS产品定价

迁移类型说明

迁移类型说明
全量数据迁移将源MongoDB数据库迁移对象的存量数据全部迁移到目标MongoDB数据库中。
说明 支持迁移database、collection和index。
增量数据迁移在全量迁移的基础上,将源MongoDB数据库的增量更新数据同步到目标MongoDB数据库中。
说明
  • 支持database、collection和index的新建和删除操作的同步。
  • 支持document的新增、删除和更新操作的同步。

数据库账号的权限要求

实例全量数据迁移增量数据迁移
MongoDB副本集实例待迁移库的read权限待迁移库、admin库和local库的read权限
MongoDB分片集群实例目标库的readWrite权限目标库的readWrite权限
说明 数据库账号创建及授权方法请参见使用DMS管理MongoDB数据库用户

准备工作

根据业务需要,在目标MongoDB实例中创建需要分片的数据库和集合,并配置数据分片,详情请参见设置数据分片以充分利用Shard性能

说明 配置数据分片可避免数据被迁移至同一Shard,导致无法发挥集群性能。

操作步骤

  1. 登录MongoDB管理控制台
  2. 在左侧导航栏,单击副本集实例列表
  3. 在页面左上角,选择实例所在的资源组和地域。
  4. 找到目标实例,单击实例ID。
  5. 在页面右上角,单击迁移MongoDB数据库
  6. 创建迁移任务页面,根据页面信息完成迁移任务配置。
    1. 设置以下参数,配置源库及目标库信息。
      配置迁移源库和目标库信息
      类别参数参数说明
      任务名称DTS会自动生成一个任务名称,建议配置具有业务意义的名称(无唯一性要求),便于后续识别。
      源库信息实例类型选择云数据库MongoDB
      实例地区选择源MongoDB实例所在地域。
      MongoDB实例ID选择源MongoDB实例ID。
      数据库名称填入鉴权数据库名,即数据库账号所属的数据库。
      说明 如果使用的数据库账号为root,那么对应的数据库名称即为admin。
      数据库账号填入源MongoDB实例的数据库账号,权限要求请参见数据库账号的权限要求
      数据库密码填入该数据库账号的密码。
      说明 源库信息填写完毕后,您可以单击数据库密码后的测试连接来验证填入的源库信息是否正确。源库信息填写正确则提示测试通过,如提示测试失败,单击测试失败后的诊断,根据提示调整填写的源库信息。
      目标库信息实例类型选择MongoDB实例
      实例地区选择目标MongoDB实例所在地域。
      MongoDB实例ID选择目标MongoDB实例ID。
      数据库名称填入鉴权数据库名,即数据库账号所属的数据库。
      说明 如果使用的数据库账号为root,那么对应的数据库名称即为admin。
      数据库账号填入目标MongoDB实例的数据库账号,权限要求请参见数据库账号的权限要求
      数据库密码填入该数据库账号的密码。
      说明 目标库信息填写完毕后,您可以单击数据库密码后的测试连接来验证填入的目标库信息是否正确。目标库信息填写正确则提示测试通过,如提示测试失败,单击测试失败后的诊断,根据提示调整填写的目标库信息。
    2. 配置完成后,单击页面下方的授权白名单并进入下一步
      如果源或目标数据库是阿里云数据库实例(例如RDS MySQL云数据库MongoDB版等),DTS会自动将对应地区DTS服务的IP地址添加到阿里云数据库实例的白名单;如果源或目标数据库是ECS上的自建数据库,DTS会自动将对应地区DTS服务的IP地址添到ECS的安全规则中,您还需确保自建数据库没有限制ECS的访问;如果源或目标数据库是IDC自建数据库或其他云数据库,则需要您手动添加对应地区DTS服务的IP地址,以允许来自DTS服务器的访问。DTS服务的IP地址,请参见DTS服务器的IP地址段
      警告 DTS自动添加或您手动添加DTS服务的公网IP地址段可能会存在安全风险,一旦使用本产品代表您已理解和确认其中可能存在的安全风险,并且需要您做好基本的安全防护,包括但不限于加强账号密码强度防范、限制各网段开放的端口号、内部各API使用鉴权方式通信、定期检查并限制不需要的网段,或者使用通过内网(专线/VPN网关/智能网关)的方式接入。
    3. 设置以下参数,选择迁移对象及迁移类型。
      迁移类型及列表
      配置说明
      迁移类型
      • 如果只需要进行全量迁移,则选中全量数据迁移
      • 如果需要进行不停机迁移,则同时选中全量数据迁移增量数据迁移
      说明 如果未选中增量数据迁移,为保障数据一致性,数据迁移期间请勿在源MongoDB数据库中写入新的数据。
      迁移对象选择迁移对象,方法如下:
      1. 迁移对象列表中,选择待迁移的对象。
      2. 单击将其移动至已选择对象列表中。
      说明
      • 不支持迁移admin和local数据库。
      • 迁移对象选择的粒度为database、collection或function。
      • 默认情况下,迁移完成后,迁移对象的名称保持不变。如果您需要改变迁移对象在目标数据库中的名称,可使用对象名映射功能,详情请参见库表列映射
      映射名称更改如需更改迁移对象在目标实例中的名称,请使用对象名映射功能,详情请参见库表列映射
      源库、目标库无法连接后的重试时间默认重试12小时,您也可以自定义重试时间。如果DTS在设置的时间内重新连接上源、目标库,迁移任务将自动恢复。否则,迁移任务将失败。
      说明 由于连接重试期间,DTS将收取任务运行费用,建议您根据业务需要自定义重试时间,或者在源和目标库实例释放后尽快释放DTS实例。
    4. 上述配置完成后,单击页面右下角的预检查并启动
      说明
      • 在迁移任务正式启动之前,会先进行预检查。只有预检查通过后,才能成功启动迁移任务。
      • 如果预检查失败,请单击失败检查项后的查看详情,并根据提示修复后重新进行预检查。
      • 如果预检查产生警告:
        • 对于不可以忽略的检查项,请单击失败检查项后的查看详情,并根据提示修复后重新进行预检查。
        • 对于可以忽略无需修复的检查项,您可以依次单击点击确认告警详情确认屏蔽确定重新进行预检查,跳过告警检查项重新进行预检查。如果选择屏蔽告警检查项,可能会导致数据不一致等问题,给业务带来风险。
    5. 预检查通过后,单击下一步
    6. 购买配置确认页面,选择链路规格,并勾选数据传输(按量付费)服务条款
    7. 单击立即购买并启动,迁移任务正式开始。
  7. 查看迁移任务进展。
    • 全量数据迁移

      请勿手动结束迁移任务,否则可能会导致数据不完整。您只需等待迁移任务完成即可,迁移任务会自动结束。

    • 增量数据迁移

      迁移任务不会自动结束,需要手动结束迁移任务。

    1. 观察迁移任务的进度变更为增量迁移,并显示为无延迟状态时,将源库停写几分钟,此时增量迁移的状态可能会显示延迟的时间。
    2. 等待迁移任务的增量迁移再次进入无延迟状态,手动结束迁移任务。增量迁移
  8. 将业务切换至目标MongoDB实例。

后续操作

根据业务需求确认是否需要释放源实例。