步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。

故障切换类型

  • 数据同步后切换

    该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步完成后再启动切换。这样可以保证容灾端与生产端数据完全一致,无数据丢失。该切换模式适用于计划内容灾演练,业务迁移等场景。

  • 立即切换

    该故障切换会尝试停止保护组中被保护的实例,不会等待所有被保护的实例停止,也不会进行最后一轮数据同步,数据在RPO范围内有部分丢失。该模式适用于生产站点确实发生短时无法恢复的故障,需立即切换至容灾站点的场景。

故障恢复类型

  • 数据同步后切换

    该故障恢复会停止保护组中被保护的实例,并且一直等到所有被保护的实例停止,再进行最后一轮数据同步,并等待数据同步完成后再启动切换,服务不可用时间会大于“立即切换”的时间,主要用在生产站点正常工作等场景。

  • 立即切换

    该故障恢复会尝试停止保护组中被保护的实例,不会等待所有被保护的实例停止,也不会进行最后一轮数据同步,立即启动切换,会导致数据有部分丢失,主要用在故障容灾的场景。

数据同步后切换

正向保护-故障切换

请参考以下步骤进行正向保护故障切换操作。

  1. 登录混合云容灾管理控制台

  2. 在左侧导航栏,单击切换到云盘异步复制型容灾

  3. 容灾站点对页面,单击目标容灾站点对,选择保护组

  4. 保护组页签,在目标保护组的操作列,单击image..png,选择正向保护>故障切换

  5. 启动故障切换对话框中,选择数据同步后切换,配置实例规格不足时的处理策略,单击确定image.png

    保护组的状态变更为正在切换

    说明
    • 当实例为节省模式停机模式时,启动时可能存在规格在可用区内库存不足的情况。选择规格族内升配,系统会优先尝试在规格族内升配,最大规格为当前规格3倍CPU或内存。

    • 自动升配失败或选择手动处理时,请您根据任务失败提示在ECS控制台改配实例规格后,在任务列表中重试任务。

    故障切换完成后,保护组状态变更为故障切换成功image.png

  6. 容灾切换完成后,单击保护组对应的管理保护实例,进入保护实例列表页面。

  7. 单击容灾站点实例ID/名称下的链接,验证ECS数据与应用。

  8. 验证完成后,在保护组的操作列,单击image..png,选择正向保护>完成切换

    保护组状态变更为确认切换完成。此时,生产站点的ECS实例状态为已停止,容灾ECS实例状态为运行中

启动反向复制

反向复制的目的,是将容灾站点数据复制到生产站点,为故障恢复做准备。

  1. 登录混合云容灾管理控制台

  2. 在左侧导航栏,单击切换到云盘异步复制型容灾

  3. 容灾站点对页面,单击目标容灾站点对,选择保护组

  4. 保护组页签,在目标保护组的操作列,单击选择启动反向复制

  5. 启动反向复制面板,单击确认

    说明

    生产端恢复正常后启动反向复制,无需创建新的实例和云盘。

    保护组状态变更为反向复制中image..png

反向保护-故障恢复

生产站点故障恢复后,您需要将容灾站点数据恢复到生产站点,完成故障恢复。在保护组状态为反向复制中并且实际RPO符合预期的情况下,您就可以进行故障恢复操作。

请参考以下步骤进行反向保护故障恢复操作。

  1. 登录混合云容灾管理控制台

  2. 在左侧导航栏,单击切换到云盘异步复制型容灾

  3. 容灾站点对页面,单击目标容灾站点对,选择保护组

  4. 保护组页签,在目标保护组的操作列,单击image..png,选择反向保护>故障恢复

  5. 启动故障恢复对话框中,选择数据同步后切换,单击确定

    保护组的状态变更为故障恢复中

    故障恢复完成后,保护组状态变更为故障恢复成功。此时,生产站点的ECS实例状态为运行中,容灾ECS实例状态为已停止image.png

  6. 确认故障恢复完成后,单击image..png,选择反向保护>完成恢复

    确认完成恢复后,保护组状态变更为初始化

立即切换

正向保护-故障切换

  1. 登录混合云容灾管理控制台

  2. 在左侧导航栏,单击切换到云盘异步复制型容灾

  3. 容灾站点对页面,单击目标容灾站点对,选择保护组

  4. 保护组页签,在目标保护组的操作列,单击image..png,选择正向保护>故障切换

  5. 启动故障切换对话框中,选择立即切换,配置实例规格不足时的处理策略,单击确定

    重要

    该操作会导致数据有部分丢失,请谨慎评估后操作。

    image.png

    保护组的状态变更为正在切换

    说明
    • 当实例为节省模式停机模式时,启动时可能存在规格在可用区内库存不足的情况。选择规格族内升配,系统会优先尝试在规格族内升配,最大规格为当前规格3倍CPU或内存。

    • 自动升配失败或选择手动处理时,请您根据任务失败提示在ECS控制台改配实例规格后,在任务列表中重试任务。

    故障切换完成后,保护组状态变更为故障切换成功image.png

  6. 容灾切换完成后,单击保护组对应的管理保护实例,进入保护实例列表页面。

  7. 单击容灾站点实例ID/名称下的链接,验证ECS数据与应用。

  8. 验证完成后,在保护组的操作列,单击image..png,选择正向保护>完成切换

    保护组状态变更为确认切换完成。此时,生产站点的ECS实例状态为已停止,容灾ECS实例状态为运行中

启动反向复制

反向复制的目的,是将容灾站点数据复制到生产站点,为故障恢复做准备。

  1. 登录混合云容灾管理控制台

  2. 在左侧导航栏,单击切换到云盘异步复制型容灾

  3. 容灾站点对页面,单击目标容灾站点对,选择保护组

  4. 保护组页签,在目标保护组的操作列,单击选择启动反向复制

  5. 启动反向复制面板,单击确认

    说明

    生产端恢复正常后启动反向复制,无需创建新的实例和云盘。

    保护组状态变更为反向复制中image..png

反向保护-故障恢复

请参考以下步骤添加待容灾保护的实例。

  1. 登录混合云容灾管理控制台

  2. 在左侧导航栏,单击切换到云盘异步复制型容灾

  3. 容灾站点对页面,单击目标容灾站点对,选择保护组

  4. 保护组页签,在目标保护组的操作列,单击启动复制

  5. 启动故障恢复对话框中,选择立即切换,配置停机模式、实例规格不足时处理策略,单击确定

    重要

    该操作会导致数据有部分丢失,请谨慎评估后操作。

    保护组的状态变更为故障恢复中

    故障恢复完成后,保护组状态变更为故障恢复成功。此时,生产站点的ECS实例状态为运行中,容灾ECS实例状态为已停止image.png

  6. 确认故障恢复完成后,单击image..png,选择反向保护>完成恢复

    确认完成恢复后,保护组状态变更为初始化

常见问题