管理容灾计划

单可用区故障可能导致计算服务中断,手动重建集群耗时且易配置偏差。通过容灾计划管理功能,可一键式保存集群配置模板,在故障发生时15分钟内自动重建同规格计算集群,保障业务连续性。

注意事项

  • 容灾计划仅恢复集群的计算服务,不恢复业务数据。业务数据(例如存储在 HDFS、OSS-HDFS 中的文件,或 Ranger、OpenLDAP 中的数据)的备份恢复方案需独立设计与实施。

  • 容灾计划创建后,其保存的配置是静态的。主集群的后续配置变更不会自动同步到已有的容灾计划中。要使用最新配置,需重新创建或手动编辑容灾计划。

  • 任何手动在主集群 ECS 实例上修改或上传的文件(例如手动放置的 JAR 包、修改的本地配置文件)都不会被保存到容灾计划中。

使用限制

  • 集群版本:若主集群使用的 EMR 产品版本已下线,则无法执行容灾计划。需编辑容灾计划,将产品版本切换为受支持的版本后方可执行。

  • 节点组规格

    • 如果主集群存在多个节点组,则仅支持恢复Master、CoreTask类型的节点组。

    • 不同可用区的节点规格和库存情况存在差异。执行容灾计划时,请根据实际情况调整节点规格。

  • 弹性伸缩规则:如果主集群中已配置弹性伸缩规则,仅支持恢复执行时间晚于当前时间的触发规则。对于按时间扩缩容的周期性规则,说明如下:

    • 规则有效期开始时间早于当前时间,结束时间早于次日0点:不支持恢复。

    • 规则有效期开始时间早于当前时间,结束时间晚于次日0点:调整开始时间为次日0点,结束时间和被克隆规则的结束时间一致。

    • 规则有效期开始时间、结束时间均晚于当前时间:开始时间、结束时间和被克隆规则的开始时间、结束时间一致。

  • 服务配置:如果主集群存在修改过的服务配置(包括创建集群时和集群使用过程中修改的服务配置),容灾计划仅支持保存集群和节点组级别的自定义服务配置。

创建容灾计划

  1. 进入容灾计划页面。

    1. 登录E-MapReduce控制台

    2. 在顶部菜单栏处,根据实际情况选择地域和资源组。

    3. EMR on ECS 页面,单击右上方的容灾计划,进入容灾计划管理页面。

  2. 容灾计划页面,单击上方的新建容灾计划

    重要

    容灾计划仅恢复集群的计算服务,不恢复业务数据。业务数据(例如存储在 HDFS、OSS-HDFS 中的文件,或 Ranger、OpenLDAP 中的数据)的备份恢复方案需独立设计与实施。

    1. 在弹出的对话框中填写以下信息,完成后单击下一步

      参数

      说明

      配置建议

      容灾计划名称

      容灾计划的名称。

      命名规则:业务_环境_用途(如 payment_prod_DR

      主集群

      选择需要创建容灾计划的集群。

      仅支持选择同一地域中运行状态的集群。

    2. 如果需要修改容灾计划的配置信息可以单击image,编辑相关信息。

  3. 确认容灾计划配置信息后,单击右下角新建容灾计划,完成创建。

执行容灾计划

  1. 进入容灾计划页面。

    1. 登录E-MapReduce控制台

    2. 在顶部菜单栏处,根据实际情况选择地域和资源组。

    3. EMR on ECS 页面,单击右上方的容灾计划,进入容灾计划管理页面。

  2. 容灾计划页面,单击目标容灾计划操作列的执行

    1. 在弹出的对话框中填写以下信息,完成后单击下一步

      参数

      说明

      容灾集群可用区

      支持选择当前地域除主集群所在可用区外的所有可用区。

      交换机

      选择在对应的VPC下对应可用区的交换机。

    2. 如果需要修改容灾计划的配置信息可以单击image.png,编辑相关信息。

  3. 确认容灾计划配置信息后,单击右下角执行容灾计划,开始创建容灾集群。

    重要
    • 按量付费集群:立刻开始创建。 集群创建完成后,集群的状态变为运行中。

    • 包年包月集群:先生成订单,支付完成订单以后集群才会开始创建。

  4. 执行容灾计划后,您可以单击目标容灾计划操作列的执行记录,查看容灾集群的创建情况。

相关文档

HDFS集群业务数据容灾方案,请参见基于OSSHDFS集群容灾方案