升配集群

当Elasticsearch(ES)集群的数据量持续增长或内存占用过高,导致原有配置无法有效应对业务负载和性能需求时,可升级ES集群配置。升级集群时,如果集群负载不高且索引有副本的情况下,集群在变更过程中可以持续对外提供服务,但性能可能会受影响,且变更时间会比较长。

前提条件

  • 完成集群规格容量评估。评估方法,请参见规格容量评估

  • 在Kibana控制台执行以下命令,检查集群中是否存在状态为close的索引。如果存在,需要将对应索引的状态暂时设置为open,否则变更不成功。

    • 查看索引状态

      GET /_cat/indices?v

      查看索引状态

    • 将close状态的索引暂时设置为open状态

      POST /<index_name>/_open

      <index_name>需要替换为状态为close的索引名称。

  • 在Kibana控制台执行以下命令,查看索引副本数,副本数需要至少为1。对于多可用区实例,在变更时需要确保集群中任意一个索引的副本数都小于可用区数,建议副本数设置为1,待变更完成后,您可以根据业务需求手动增加副本数,详情请参见索引模板

    说明

    如果副本数为0,将无法实现高可用机制,业务稳定性无保证。

    GET _cat/indices?v

注意事项

注意事项

说明

服务影响

  • 升配集群会触发集群重启,重启时间与集群规格、数据结构和大小等因素有关,建议在业务低峰期操作。一般情况下,重启耗时较长,在小时级别。详细信息,请参见重启实例或节点

    重要
    • 如果集群索引存在副本分片且集群负载处于正常水平(CPU使用率在60%左右,堆内存使用率在50%左右,load_1m低于CPU核数),一般情况下,在集群变更过程中可持续对外提供服务。

    • 如果集群负载高且索引没有副本,同时在升配或者降配过程中存在大量的写入或查询等情况,业务可能会出现偶发的访问超时现象。建议在集群变更前,在客户端访问重试机制及增加副本数,以减小对业务的影响。

    • 升配过程中不会出现数据丢失的现象,但如果集群负载高或状态异常,访问可能出现偶发的超时抖动,建议您业务上做好重试机制,并为索引分片配置副本。

  • 如果实例为非正常状态(黄色或红色),在升配集群时,需要勾选强制变更,忽略集群健康状态,此操作可能会影响服务。

  • 升配集群时,如果使用了蓝绿变更,会导致节点IP地址发生变化。如果在集群配置中指定了节点IP地址,请在变更完成后及时更新。

计费变化

提交了升配订单后,实例将按照更新后的订单计费。计费规则,请参见按量付费包年包月

说明

在升配集群时,您可以在变配页面,实时观察更新后的订单消费金额。

版本升级

不支持在升配集群时升级版本,需要通过版本升级功能升级。详细信息,请参见升级版本

说明
  • 如果在升配集群时,版本变更不符合要求,系统会提示UpgradeVersionMustFromConsole。

  • 自2021年5月起,阿里云Elasticsearch不再支持新购7.4版本的实例,不影响存量实例的使用。建议您重新选购7.10版本实例,然后再迁移数据。迁移数据的具体方案,请参见迁移方案选取指南

规格升配

每次只能变更一种节点类型(数据节点、冷数据节点、协调节点、专有主节点、Kibana节点、弹性节点)的规格配置。

说明

如果您需要减少数据节点个数,可通过缩容数据节点功能实现。具体操作方法和限制,请参见缩容集群数据节点

磁盘类型升配

支持存储性能较低的云盘升配到存储性能较高的云盘,云盘存储性能由低到高依次为:高效云盘、SSD云盘、ESSD云盘,您可以根据需求进行升配。

说明

系统不支持将SSD升配到ESSD-PL0。

可用区规格库存

在升配集群时,如果遇到可用区规格库存不足的问题,可迁移该可用区下的节点后再升配。具体操作,请参见迁移可用区节点

分片分配

变更后,分片将自动均衡。在特殊场景下,可能会存在负载不均的情况,例如分片设置不合理导致各节点数据分配不均。集群负载不均的排查方法和解决方案,请参见集群负载不均问题的分析方法及解决方案

操作步骤

  1. 登录阿里云Elasticsearch控制台
  2. 在左侧导航栏,单击Elasticsearch实例
  3. 在顶部菜单栏,选择资源组和地域。

  4. 在实例列表中,找到目标实例,单击其右侧的升配

  5. 在升配页面,选择待升配的节点类型,单击修改

    升配页面支持修改各集群的节点规格、存储类型、单节点存储空间等配置。

    变配页面的当前配置区域,展示了当前实例的配置信息,便于您在执行升配操作时参考。

    请根据实际业务需求,通过页面提示修改实例配置。参数详情,请参见ES实例节点配置说明,部分参数说明如下。

    参数

    说明

    内核增强版高级特性

    Indexing Service索引构建服务和Openstore智能混合存储,均不支持升配时开启,已开启的也不支持关闭。

    数据节点

    数据节点规格族云盘型时,您可以增大数据单节点存储空间。数据节点存储类型不同,支持的最大存储空间也不同,具体限制可在控制台上查看。详细信息,请参见数据节点

    重要
    • 当集群处于非健康状态(黄色或红色)时,不支持将高效云盘升配超过2 TiB。如果您有超过2 TiB的需求,需要保证集群处于健康状态,或者在升配时增加数据节点个数。

    • 1核2 GB规格实例只适合于测试场景,不适用于生产环境。根据产品SLA协议不在售后保障范围内,建议您尽快将1核2 GB规格升级至高规格。

    专有主节点

    支持新购专有主节点,或者升配已购买的专有主节点的规格。详细信息,请参见专有主节点

    冷数据节点

    支持新购冷数据节点,或者升配已购买的冷数据节点的规格。详细信息,请参见冷数据节点

    协调节点

    支持新购协调节点,或者升配已购买的协调节点的规格。详细信息,请参见协调节点

    Kibana节点

    支持升配已购买的Kibana节点的规格。详细信息,请参见Kibana节点

    重要

    购买阿里云Elasticsearch实例时,Kibana节点默认为启用状态,不可更改。受规格性能及稳定性影响,推荐购买2核4 GB及以上规格的Kibana节点;1核2 GB规格的Kibana节点免费赠送,但仅建议在测试场景中使用。

    弹性节点

    支持新购弹性节点,或者升配已购买的弹性节点的规格。详细信息,请参见弹性扩缩集群资源

    强制变更

    如果实例为非正常状态(红色或黄色),且服务已受到严重影响,急需通过扩容来解决,建议使用强制变更

    重要
    • 强制变更将忽略实例的健康性,可加速变更进度,但集群状态恢复实际需要的时长与数据量、集群压力、配置相关。

    • 强制变更会重启实例,可能会导致服务在重启阶段不稳定。

    • 未启用强制变更时,系统默认使用重启方式升配集群。相关注意事项,请参见重启实例或节点

    智能变更

    默认开启。开启智能变更时,后端会根据您的变更操作类型自动选择合适的变更方式。您也可以手动关闭智能变更,关闭后,您可以指定变更方式,支持蓝绿变更原地变更

    • 蓝绿变更:为集群添加相同数量的新节点并拷贝数据,之后无缝切换到新节点,变更过程相对平滑但耗时较长。蓝绿变更会导致节点IP地址发生变化,如果在集群配置中指定了节点IP地址,请在变更完成后及时更新。

    • 原地变更:对集群中所需变更的节点逐个滚动变更。变更无需拷贝数据,时间不受数据规模影响,但会对集群的性能产生一定影响。

    更多详细信息,请参见变更方式介绍

    说明

    如果您的业务无特殊需求,建议开启智能变更

  6. 选中服务协议,单击立即购买

    购买后,集群会重启,重启成功后即可完成集群升配。

常见问题

相关文档