单可用区故障可能导致计算服务中断,手动重建集群耗时且易配置偏差。通过容灾计划管理功能,可一键式保存集群配置模板,在故障发生时15分钟内自动重建同规格计算集群,保障业务连续性。
注意事项
容灾计划仅恢复集群的计算服务,不恢复业务数据。业务数据(例如存储在 HDFS、OSS-HDFS 中的文件,或 Ranger、OpenLDAP 中的数据)的备份恢复方案需独立设计与实施。
容灾计划创建后,其保存的配置是静态的。主集群的后续配置变更不会自动同步到已有的容灾计划中。要使用最新配置,需重新创建或手动编辑容灾计划。
任何手动在主集群 ECS 实例上修改或上传的文件(例如手动放置的 JAR 包、修改的本地配置文件)都不会被保存到容灾计划中。
使用限制
集群版本:若主集群使用的 EMR 产品版本已下线,则无法执行容灾计划。需编辑容灾计划,将产品版本切换为受支持的版本后方可执行。
节点组规格:
如果主集群存在多个节点组,则仅支持恢复Master、Core和Task类型的节点组。
不同可用区的节点规格和库存情况存在差异。执行容灾计划时,请根据实际情况调整节点规格。
弹性伸缩规则:如果主集群中已配置弹性伸缩规则,仅支持恢复执行时间晚于当前时间的触发规则。对于按时间扩缩容的周期性规则,说明如下:
规则有效期开始时间早于当前时间,结束时间早于次日0点:不支持恢复。
规则有效期开始时间早于当前时间,结束时间晚于次日0点:调整开始时间为次日0点,结束时间和被克隆规则的结束时间一致。
规则有效期开始时间、结束时间均晚于当前时间:开始时间、结束时间和被克隆规则的开始时间、结束时间一致。
服务配置:如果主集群存在修改过的服务配置(包括创建集群时和集群使用过程中修改的服务配置),容灾计划仅支持保存集群和节点组级别的自定义服务配置。
创建容灾计划
进入容灾计划页面。
在顶部菜单栏处,根据实际情况选择地域和资源组。
在 EMR on ECS 页面,单击右上方的容灾计划,进入容灾计划管理页面。
在容灾计划页面,单击上方的新建容灾计划。
重要容灾计划仅恢复集群的计算服务,不恢复业务数据。业务数据(例如存储在 HDFS、OSS-HDFS 中的文件,或 Ranger、OpenLDAP 中的数据)的备份恢复方案需独立设计与实施。
在弹出的对话框中填写以下信息,完成后单击下一步。
参数
说明
配置建议
容灾计划名称
容灾计划的名称。
命名规则:
业务_环境_用途
(如payment_prod_DR
)主集群
选择需要创建容灾计划的集群。
仅支持选择同一地域中运行状态的集群。
如果需要修改容灾计划的配置信息可以单击
,编辑相关信息。
确认容灾计划配置信息后,单击右下角新建容灾计划,完成创建。
执行容灾计划
进入容灾计划页面。
在顶部菜单栏处,根据实际情况选择地域和资源组。
在 EMR on ECS 页面,单击右上方的容灾计划,进入容灾计划管理页面。
在容灾计划页面,单击目标容灾计划操作列的执行。
在弹出的对话框中填写以下信息,完成后单击下一步。
参数
说明
容灾集群可用区
支持选择当前地域除主集群所在可用区外的所有可用区。
交换机
选择在对应的VPC下对应可用区的交换机。
如果需要修改容灾计划的配置信息可以单击
,编辑相关信息。
确认容灾计划配置信息后,单击右下角执行容灾计划,开始创建容灾集群。
重要按量付费集群:立刻开始创建。 集群创建完成后,集群的状态变为运行中。
包年包月集群:先生成订单,支付完成订单以后集群才会开始创建。
执行容灾计划后,您可以单击目标容灾计划操作列的执行记录,查看容灾集群的创建情况。
相关文档
HDFS集群业务数据容灾方案,请参见基于OSS的HDFS集群容灾方案。