文档

ES诊断状态异常|集群频繁变更异常

更新时间:
一键部署

问题描述

Elasticsearch智能诊断提示集群状态变更频繁,过去24小时内状态发生频繁变更。

问题原因

集群在近24小时内有修改配置、重启、扩缩容、快照备份等情况导致集群多次变更,引起CPU徒增,导致集群这段时间内持续高负载引发诊断异常。

解决方案

1. 根据诊断建议可以先自行确认排查(频繁的集群创建、删除、打开、关闭索引避免在高峰期操作)。

2. 诊断结果仅供集群排查作为参考,建议结合 GET _cat/health?v  GET  _cat/allocation?v GET _cluster/allocation/explain 高级监控等运维工具进行排查分析。如果集群本身有高负载需求,使用过程中也不影响集群访问,数据读写可以忽略上面信息。

更多信息

关于集群优化的更多建议:

1. 合理分配shard,目的是保证各个节点负载均衡(主分片和副本分片之和满足节点个数的整数倍)
2. 定期清理缓存和目前占用空间且无用的索引(可以节约成本并释放资源空间)
3. 控制写入的并发量(如果请求过高容易触发熔断, 业务场景要根据集群实例规格量力而行)

适用范围

检索分析服务Elasticsearch版

相关文档:

诊断集群健康状况

  • 本页导读
文档反馈