当您修改了实例或节点的配置或进行其他操作时,可能需要重启阿里云Elasticsearch(简称ES)才能生效。通过阿里云ES的重启功能,您可以完成实例或节点的重启。本文介绍如何通过控制台重启阿里云ES实例或节点。

前提条件

请确保实例的状态正常(绿色)、索引至少包含1个副本、资源使用率不是很高。
说明 资源使用率可在集群监控页面查看,例如节点CPU使用率为80%左右,节点HeapMemory使用率为50%左右,节点load_1m低于当前数据节点的CPU核数,详情请参见集群监控指标说明

重启实例

  1. 登录阿里云Elasticsearch控制台
  2. 在顶部菜单栏处,选择地域。
  3. 单击目标实例ID/名称链接。
  4. 基本信息页面,单击右上角的重启
  5. 重启对话框中,配置重启参数。
    重启ES实例
    注意 如果集群整体负载不高且索引存在副本分片,一般情况下重启过程中可对外持续提供服务。但在某些场景下,重启过程中可能会出现访问超时,例如强制重启并发度高、集群负载很高并且已经存在集群访问不可用的情况、没有副本分片、在重启或强制重启过程中存在大量的写入和查询等场景,建议重启前先在客户端设计好重试机制。
    参数 说明
    操作类型 支持实例重启节点重启
    • 实例重启:重启实例中所包含的所有节点。
    • 节点重启:重启所选的单个节点,详情请参见重启节点
    重启方式 支持重启强制重启
    • 重启:当实例的状态正常(绿色)时,才可进行重启,否则需要进行强制重启。实例在重启过程中可持续提供服务(需要首先满足上文的前提条件),但耗时较长。
      注意
      • 节点在重启期间,对应的CPU和内存使用率会存在临时突增的情况,可能会造成服务抖动,正常情况下过一段时间后会恢复正常。
      • 目前阿里云ES实例重启耗时与实例的数据总量、节点数量、总索引数量和分片数量等因素有关。您可以在任务列表中查看实例的重启进度。
    • 强制重启:当实例显示为非正常状态(黄色或红色),此时将不支持重启操作,需要对实例进行强制重启。
      注意 当磁盘的使用率超过cluster.routing.allocation.disk.watermark.low的配置时,可能会导致阿里云ES实例的状态变为非正常状态(黄色或红色)。当实例处于非正常状态时,不建议对实例进行节点扩容、磁盘扩容、重启、修改密码或其他变更配置类的操作,请务必保证实例的状态变为正常(绿色)后再进行这些操作。
    设置并发度 通过设置并发度可提升实例的强制重启速度。并发值越高,强制重启越快,默认是:1/实例总节点数。
    预计所需总时间 按照前一次单节点重启时间的均值,乘以总节点个数进行评估。可能存在误差,实际以真实重启时间为准。
  6. 单击确认开始重启实例。
    说明 如果是强制重启,需要先勾选确认要强制重启,进行重启确认。

    重启过程中,实例状态会显示为生效中(黄色),可在任务列表中查看实例变更详情。重启成功后,实例状态会显示为正常(绿色)。

    重启实例状态

重启节点

重启节点是指重启所选的单个节点。操作方法和注意事项与重启实例类似,不同之处包含以下几点。

节点重启
  • 需要在重启对话框中,选择操作类型节点重启
  • 需要选择待重启的节点。
    注意 当实例处于非正常状态时,单节点也需要进行强制重启。
  • 提供了蓝绿变更功能。勾选蓝绿变更后进行重启,阿里云ES会在集群中添加一个新节点,将原节点上的数据迁移到新节点后,再将原节点删除。当集群中单个节点出现硬件故障时,通过蓝绿变更功能,可以将故障节点移出集群。
    警告
    • 请确保实例处于正常(绿色)状态,以正常的方式触发蓝绿变更重启。使用蓝绿变更时,不允许对实例进行强制重启
    • 勾选蓝绿变更后进行重启时,会导致节点IP地址发生变化,请确认后再进行操作。