全部产品

集群修复

更新时间:2020-11-27 11:26

E-HPC控制台提供对集群的修复功能,用户可通过修复操作对异常不可用集群节点进行二次修复操作。

进入E-HPC管理控制台的集群页找到将要进行修复操作的集群,在集群右侧“更多”按钮下拉框中选择“修复”按钮,点击弹出集群修复配置框。

配置参数

参数名称 描述
镜像类型 可为集群重新指定镜像类型,默认值为上一次原始数值。
镜像 在集群修复时,可重新为集群指定新的镜像操作系统。
调度器 在修复集群时,可重新为集群指定调度器类型。当调度器重新指定后,集群节点的默认队列也将相应发生改变。
域账号服务 在修复集群时,可重新为集群指定域账号服务类型 。

说明:

  • E-HPC尝试修复集群故障后,集群所有节点执行更换系统盘的操作,按创建集群时的配置重新配置系统盘,该集群所有节点上实例系统盘和数据盘的数据将会丢失,包括用户、作业信息、调度器队列信息、自动伸缩队列配置信息,但文件存储NAS上的数据仍然保留。
  • 修复操作后,集群节点实例继续保留,节点实例将全部迁移到集群默认队列中,集群自建队列被清除。

操作步骤

  • 进入E-HPC管理控制台的集群页面。
  • 点击集群右侧“更多”下拉框中的“修复”按钮。
  • 在集群修复弹出框配置镜像,调度器,域账号等信息。
  • 点击“确认”按钮,即可启动修复操作。
  • 提交确认后,返回到集群页面,集群状态重新进入“安装中”,则表示集群已经开始修复。