当您对集群中现有或新增的节点组启用了自动补偿功能后,如果E-MapReduce(简称EMR)监测到集群中的ECS实例无法支持引擎服务正常运行,对于按量付费的Task节点,EMR将自动尝试购买新的ECS实例来替换故障实例;对于包年包月的Task节点,EMR将对故障实例实施重新部署,以确保服务稳定。
前提条件
已创建数据湖(DataLake)、实时数据流(DataFlow)或自定义场景(Custom)的集群,并部署了YARN服务,详情请参见创建集群。
使用限制
仅Task节点组,支持该功能。
注意事项
当集群出现以下情况时,自动补偿功能可能会失败:
待替换的ECS实例出现系统问题。
待替换的ECS实例开启了释放保护。
待替换的ECS实例所属节点组的节点数小于或等于节点组限定的最小节点数。
新补偿的ECS实例会在扩容流程中自动运行引导操作脚本,但是已经手动部署在待替换ECS实例中的组件或服务,仍需在新购的ECS实例上重新部署。
开启或关闭自动补偿
进入节点管理页面。
在顶部菜单栏处,根据实际情况选择地域和资源组。
单击目标集群操作列的节点管理。
在节点管理页面,单击节点组名称。
在弹出的节点组属性面板中,可以开启或关闭自动补偿的开关。
说明从2023年7月10日18:00(UTC+8)开始,新建按量付费的Task节点组时默认开启自动补偿开关。
在弹出的对话框中,单击确定。
单击保存。
查看自动补偿状态
在节点管理页面,可以查看自动补偿状态。
如果节点组开启了自动补偿,且在一周内发生了自动补偿操作,则在自动补偿状态列中会展示发生的次数,将鼠标悬浮至次数上,在提示信息中单击前往查看事件详情,可查看事件详情。
该文章对您有帮助吗?