调用RecoverCluster重置并修复异常集群。

接口说明

仅当集群状态为exception(异常)时,才能调用该接口重置并修复集群。您可以通过调用ListClusters获取集群ID及集群状态。

建议您操作前导出所有作业数据。重置并修复集群会有以下影响:

  • 集群所有节点执行更换系统盘的操作,按创建集群时的配置重新配置系统盘。
  • 集群所有节点的系统盘和数据盘的数据将会丢失,包括用户信息、作业信息、调度器队列信息、自动伸缩队列配置信息,但文件存储NAS上的数据仍然保留。
  • 集群自建队列被清除,节点实例继续保留,并全部迁移到集群默认队列中。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

请求参数

名称 类型 是否必选 示例值 描述
Action String RecoverCluster

系统规定参数。取值:RecoverCluster

ClusterId String ehpc-hz-FYUr32****

指定重置并修复的集群ID。并且,集群状态必须为exception(异常)时才能修复。

您可以通过调用ListClusters获取集群ID及集群状态。

OsTag String CentOS_7.2_64

操作系统镜像标签。

您可以通过ListImagesListCustomImages查询E-HPC支持的镜像标签。

AccountType String nis

账户服务类型。取值范围:

  • nis
  • ldap

默认值:nis

SchedulerType String pbs

调度服务器类型。取值范围:

  • pbs
  • slurm
  • opengridscheduler
  • deadline

默认值:pbs

ImageOwnerAlias String system

镜像类型。取值范围:

  • system:公共镜像
  • self:自定义镜像
  • others:共享镜像

默认值:system

ImageId String m-bp18133n0335yq****

镜像ID。

您可以通过ListImagesListCustomImages查询E-HPC可安装的镜像。

ClientVersion String 1.0.76

集群所使用的客户端版本号,默认为最新版本。

您可以调用ListCurrentClientVersion查询当前最新客户端版本号。

返回数据

名称 类型 示例值 描述
RequestId String 18FB21E3-F423-4B84-BB63-D8887A29****

请求ID。

TaskId String 18FB21E3-F423-4B84-BB63-D8887A29****

任务ID。

示例

请求示例

https://ehpc.cn-hangzhou.aliyuncs.com/?Action=RecoverCluster
&ClusterId=ehpc-hz-FYUr32****
&<公共请求参数>

正常返回示例

XML格式

<RecoverClusterResponse>
      <TaskId>18FB21E3-F423-4B84-BB63-D8887A29****</TaskId>
      <RequestId>18FB21E3-F423-4B84-BB63-D8887A29****</RequestId>
</RecoverClusterResponse>

JSON格式

{
	"TaskId": "18FB21E3-F423-4B84-BB63-D8887A29****",
	"RequestId": "18FB21E3-F423-4B84-BB63-D8887A29****"
}

错误码

HttpCode 错误码 错误信息 描述
503 ServiceUnavailable The request has failed due to a temporary failure of the server 请求失败,服务暂时不可用

访问错误中心查看更多错误码。