节点补偿

当您对集群中现有或新增的节点组启用了自动补偿功能后,如果E-MapReduce(简称EMR)监测到集群中的ECS实例无法支持引擎服务正常运行,对于按量付费的Task节点,EMR将自动尝试购买新的ECS实例来替换故障实例;对于包年包月的Task节点,EMR将对故障实例实施重新部署,以确保服务稳定。

前提条件

已创建数据湖(DataLake)、实时数据流(DataFlow)或自定义场景(Custom)的集群,并部署了YARN服务,详情请参见创建集群

使用限制

Task节点组,支持该功能。

注意事项

  • 当集群出现以下情况时,自动补偿功能可能会失败:

    • 待替换的ECS实例出现系统问题。

    • 待替换的ECS实例开启了释放保护。

    • 待替换的ECS实例所属节点组的节点数小于或等于节点组限定的最小节点数。

  • 新补偿的ECS实例会在扩容流程中自动运行引导操作脚本,但是已经手动部署在待替换ECS实例中的组件或服务,仍需在新购的ECS实例上重新部署。

开启或关闭自动补偿

  1. 进入节点管理页面。

    1. 登录E-MapReduce控制台

    2. 在顶部菜单栏处,根据实际情况选择地域和资源组

    3. 单击目标集群操作列的节点管理

  2. 节点管理页面,单击节点组名称。

  3. 在弹出的节点组属性面板中,可以开启或关闭自动补偿的开关。

    说明

    202371018:00(UTC+8)开始,新建按量付费的Task节点组时默认开启自动补偿开关。

  4. 在弹出的对话框中,单击确定

  5. 单击保存

查看自动补偿状态

节点管理页面,可以查看自动补偿状态。

如果节点组开启了自动补偿,且在一周内发生了自动补偿操作,则在自动补偿状态列中会展示发生的次数,将鼠标悬浮至次数上,在提示信息中单击前往查看事件详情,可查看事件详情。

image.png