当您的业务存在高低峰期或其他变化,导致集群节点规格高于业务所需规格时,可通过阿里云Elasticsearch的集群降配功能,降低节点规格配置、变更节点磁盘类型等,以更好地保障业务发展并控制成本。本文介绍阿里云Elasticsearch降配集群的操作方法、相关说明和注意事项。

前提条件

  • 确保集群为正常(绿色)状态。
  • 登录Kibana控制台,执行以下命令,检查集群中是否存在状态为close的索引。如果存在,需要将对应索引的状态暂时设置为open,否则变更不成功。
    • 查看索引状态
      GET /_cat/indices?v
      查看索引状态
    • 将close状态的索引暂时设置为open状态
      POST /<index_name>/_open

      <index_name>需要替换为状态为close的索引名称。

使用限制

  • 节点磁盘空间和Kibana节点规格,不支持降配操作。
  • 目前不支持弹性数据节点降配。
  • 集群需满足以下条件才可降配:
    • 操作时间间隔

      对于同一集群,两次降配操作时间间隔不得少于30分钟。

    • 集群负载

      集群中可能包含多种类型的节点。节点类型不同,当前CPU使用率和JVM堆内存使用率的要求不同,具体如下。

      节点类型 当前CPU使用率 当前JVM堆内存使用率
      专有主节点 单节点最大值 < 30% 单节点最大值 < 25%
      数据节点 同时满足以下条件:
      • 单节点最大值 < 60%
      • 所有节点平均值 < 40%
      同时满足以下条件:
      • 单节点最大值 < 50%
      • 所有节点平均值 < 30%
      协调节点 同时满足以下条件:
      • 单节点最大值 < 50%
      • 所有节点平均值 < 30%
      同时满足以下条件:
      • 单节点最大值 < 50%
      • 所有节点平均值 < 30%
      冷数据节点 同时满足以下条件:
      • 单节点最大值 < 60%
      • 所有节点平均值 < 40%
      同时满足以下条件:
      • 单节点最大值 < 50%
      • 所有节点平均值 < 30%
    • 规格

      降配所选的目标规格的CPU和内存均需大于或等于当前规格的1/2,且不支持将节点规格降配至1核2 GB、2核2 GB、4核4 GB和2核4 GB。

    • 云盘类型降配

      支持存储性能较高的云盘降配到存储性能较低的云盘,云盘存储性能由高到低依次为:ESSD云盘、SSD云盘、高效云盘,您可以根据需求进行降配。云盘更多详细信息请参见云盘概述

      说明 系统不支持将ESSD-PL0降配到SSD。

注意事项

  • 降配集群会触发集群重启,关于重启方式和重启时间的具体说明如下:
    • 重启方式为滚动重启。重启不会导致服务中断,但可能会影响集群的稳定性,例如节点CPU和内存使用率临时突增,为了减少对业务的影响,建议在业务低峰操作。
    • 重启时间与集群规格、数据结构和大小等因素有关。一般情况下,重启耗时较长,在小时级别。
  • 请结合规格容量评估使用限制,确保降配后集群有足够的存储空间。如果降配后集群负载较高,建议及时升配,具体操作请参见升配集群
  • 对于非标准规格的集群,例如集群仅有两个数据节点,降配可能导致额外的风险(例如数据丢失),请谨慎操作。
  • 对于多可用区实例,在变更时,需要确保集群中任意一个索引的副本数都小于可用区数。待变更完成后,您可以根据业务手动增加副本数。详细信息请参见索引模板

操作步骤

  1. 登录阿里云Elasticsearch控制台
  2. 在左侧导航栏,单击Elasticsearch实例
  3. 在顶部菜单栏,选择资源组和地域。再在左侧导航栏,单击Elasticsearch实例
  4. 在实例列表中,选择目标实例右侧操作列下的更多 > 降配
  5. 选择待降配的节点类型,单击修改
  6. 在展开的节点配置中,修改节点的规格或存储类型。
    降配
    注意
    • 系统只展示可变更的规格。
    • 每次只能变更一种节点类型的配置,同时支持同一类型节点的多种变更。例如支持变更数据节点规格的同时,变更其存储类型。
    • 变更节点数后,集群不会自动重新规划分片,可能导致数据在分片上的分配不均匀。分片分配不均的排查方法和解决方案请参见集群负载不均问题的分析方法及解决方案
  7. 查看并选中服务协议和风险提示,单击立即购买
    购买后,集群会重启,重启成功后即可完成集群降配。
    说明 降配操作触发的重启方式为滚动重启。滚动重启不会中断集群服务,但可能会影响集群的稳定性,建议在业务低峰期操作。

常见问题

相关文档

降配集群的API文档:UpdateInstance