阿里云Elasticsearch(简称ES)的实例管理模块,提供了集群监控、重启实例、刷新实例、任务列表等功能。

进入实例管理页面

ES实例创建成功后,在实例列表页面单击实例名称/ID链接,进入实例管理页面。实例管理页面

重启实例

重启分为实例级别重启和节点级别重启,本节介绍实例级别重启。实例级别重启是指重启实例中所包含的所有节点。

当您修改了集群的配置或进行其他操作时,可能需要重启阿里云ES实例才能生效。

前提条件:在重启阿里云ES实例前,您需要确保实例的状态正常(绿色)、索引至少包含1个副本、资源使用率不是很高(可在集群告警页面查看,例如节点CPU使用率为80%左右或以下,节点HeapMemory使用率为50%左右,节点load_1m低于当前数据节点的CPU核数)。

  1. 进入阿里云Elasticsearch控制台,单击实例ID/名称链接。
  2. 在实例的基本信息页面,单击右上角的重启
  3. 重启实例弹出框中,选择操作类型实例重启
    说明 您也可以选择操作类型为节点重启节点重启需要选择待重启的节点,详情请参见重启节点
  4. 选择重启方式
    阿里云ES支持重启强制重启两种重启实例的方式:重启ES实例
    • 重启
      阿里云ES实例在重启过程中可持续提供服务(需要首先满足以上前提条件),但耗时较长。
      注意
      • 在进行重启前,请确保实例的状态正常(显示为绿色),否则需要进行强制重启
      • 节点在重启期间,对应的CPU和内存使用率会存在临时突增的情况,您的服务可能会出现抖动,正常情况下过一段时间后会恢复正常。
      • 目前阿里云ES实例重启耗时与实例的数据总量、节点数量、总索引数量和分片数量等因素有关,暂无法预估具体的耗时长短。您可以在任务列表中查看实例的重启进度。
    • 强制重启
      当集群显示为非健康状态(黄色/红色),此时将不支持重启操作,需要对实例进行强制重启。强制重启操作可能会导致阿里云ES实例在重启阶段的服务不稳定,但耗时较短。
      注意 当磁盘的使用率超过cluster.routing.allocation.disk.watermark.low的配置时,阿里云ES实例的状态可能显示为非健康状态(黄色/红色),此时将不支持重启操作,需要进行强制重启
      • 如果创建的阿里云ES实例处于非健康状态(黄色/红色),此时不建议对实例进行节点扩容磁盘扩容重启修改密码或其他变更配置类的操作,请务必保证集群状态变为绿色后再进行这些操作。
      • 可通过设置并发度提升重启速度,并发值越高,强制重启越快,并发值默认是1个节点的百分比(1/集群总节点数)。
      • 当您的阿里云ES实例包括了两个及两个以上节点,在上述情况下进行变更配置时,如果集群一直处于生效中的状态,您可以提交工单,联系阿里云ES技术工程师处理。
  5. 单击确认开始重启实例。
    重启过程中,实例状态显示为生效中(黄色),可在任务列表中查看实例变更详情。重启成功后,实例状态显示为正常(绿色)。重启实例状态

重启节点

重启分为实例级别重启和节点级别重启,本节介绍节点级别重启。节点级别重启是指重启所选的单个节点。

当您修改了节点的配置或进行其他操作时,可能需要重启ES节点才能生效。操作方法与注意事项与重启实例类似,不同之处包含以下几点:节点重启
  • 需要在重启对话框中,选择操作类型节点重启
  • 需要选择待重启的节点。
    注意 当集群不健康时,单节点也需要进行强制重启。
  • 提供了蓝绿变更功能。勾选蓝绿变更后进行重启,ES会在集群中添加一个新节点,将原节点上的数据迁移到新节点后,再将原节点删除。当集群中单个节点出现硬件故障时,通过蓝绿变更功能,可将故障节点移出集群。
    警告
    • 请确保集群处于正常(绿色)状态,以正常的方式触发蓝绿变更重启。使用蓝绿变更时,不允许对集群进行强制重启
    • 勾选蓝绿变更后进行重启时,会导致节点IP发生变化,请确认后再进行操作。不勾选进行重启时,节点的IP不会发生变化。

刷新实例

当控制台中实例的信息没有及时更新时,例如刚创建完成的阿里云ES实例状态显示失败,可以通过刷新功能,手动刷新页面中的状态信息。

进入实例管理页面,单击右上角的刷新。刷新成功后,实例信息显示正常。如果依然存在异常信息,请联系阿里云ES技术工程师处理。

查看任务进度详情

您可以通过任务列表查看正在进行中的任务信息,例如实例的创建进度和重启进度。

  1. 进入实例管理页面,单击右上角的任务列表任务列表图标)图标。
  2. 任务列表页面中,查看实例变更进度。
  3. 单击展开详情,查看各任务的进度详情。查看任务进度详情

中断变更

  1. 进入实例管理页面,单击右上角的任务列表任务列表图标)图标。
  2. 任务列表页面中,查看实例变更进度。
  3. 单击中断变更中断变更
  4. 在弹出的变更中断对话框中,认真阅读风险提示,并勾选已经知晓实例变更中断风险,仍然要中断实例变更,单击确认变更中断
    说明 中断变更生效需要一段时间,请耐心等候。
  5. 等待中断变更生效后,可在任务列表中单击恢复变更,继续完成之前的集群变更。恢复变更
    注意
    • 实例处于变更中断状态,可能会导致集群服务受到影响,支持通过二次变更或手动操作恢复变更 。二次变更支持集群升配,插件管理。
    • 触发恢复变更操作后,整个重启流程会重新执行一遍,也就是集群中的节点会再进行一次重启,请耐心等待。

集群监控

阿里云ES实例已支持对实例进行监控,并允许通过短信的方式报警。

进入实例管理页面,单击右上角的集群监控,在云监控控制台中根据需求自定义报警阈值,详情请参见ES云监控报警