RecoverCluster - 重置并修复集群

调用RecoverCluster重置并修复异常集群。

接口说明

仅当集群状态为 exception(异常)时,才能调用该接口重置并修复集群。您可以通过调用 ListClusters 获取集群 ID 及集群状态。 建议您操作前导出所有作业数据。重置并修复集群会有以下影响:

  • 集群所有节点执行更换系统盘的操作,按创建集群时的配置重新配置系统盘。
  • 集群所有节点的系统盘和数据盘的数据将会丢失,包括用户信息、作业信息、调度器队列信息、自动伸缩队列配置信息,但文件存储 NAS 上的数据仍然保留。
  • 集群自建队列被清除,节点实例继续保留,并全部迁移到集群默认队列中。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。
  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:
    • 对于必选的资源类型,用背景高亮的方式表示。
    • 对于不支持资源级授权的操作,用全部资源表示。
  • 条件关键字:是指云产品自身定义的条件关键字。
  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作访问级别资源类型条件关键字关联操作
ehpc:RecoverClusterWrite
  • 全部资源
    *

请求参数

名称类型必填描述示例值
ClusterIdstring

指定重置并修复的集群 ID。并且,集群状态必须为 exception(异常)时才能修复。

您可以通过调用 ListClusters 获取集群 ID 及集群状态。

ehpc-hz-FYUr32****
OsTagstring

操作系统镜像标签。

您可以通过 ListImagesListCustomImages 查询 E-HPC 支持的镜像标签。

CentOS_7.2_64
AccountTypestring

账户服务类型。取值范围:

  • nis
  • ldap

默认值:nis

nis
SchedulerTypestring

调度服务器类型。取值范围:

  • pbs
  • slurm
  • opengridscheduler
  • deadline

默认值:pbs

pbs
ImageOwnerAliasstring

镜像类型。取值范围:

  • system:公共镜像
  • self:自定义镜像
  • others:共享镜像

默认值:system

system
ImageIdstring

镜像 ID。

您可以通过 ListImagesListCustomImages 查询 E-HPC 可安装的镜像。

m-bp18133n0335yq****
ClientVersionstring

集群所使用的客户端版本号,默认为最新版本。

您可以调用 ListCurrentClientVersion 查询当前最新客户端版本号。

1.0.76

返回参数

名称类型描述示例值
object
TaskIdstring

任务 ID。

18FB21E3-F423-4B84-BB63-D8887A29****
RequestIdstring

请求 ID。

18FB21E3-F423-4B84-BB63-D8887A29****

示例

正常返回示例

JSON格式

{
  "TaskId": "18FB21E3-F423-4B84-BB63-D8887A29****",
  "RequestId": "18FB21E3-F423-4B84-BB63-D8887A29****"
}

错误码

HTTP status code错误码错误信息描述
400InvalidParamsThe specified parameter %s is invalid.无效的参数:%s
400InDebtYour account has overdue payments.您的账户已欠费
400OrderError.InsufficientBalanceThe account balance is insufficient. Please add funds first and try again.账户已欠费,请您先充值后再重试。
400OrderError.InstHasUnpaidOrderYour account has an unpaid order.账户存在未支付订单,请您先支付后再重试。
400OrderError.ArrearageYour account balance is less than CNY 100. Please add funds to your account and try again.账户余额不足100元,请您先充值后再重试。
400OrderError.NoCardNo credit card is bound to your account.未绑定卡,请您先绑定后再重试。
400OrderError.InvalidPayMethodNo valid default payment method is specified for your account.没有有效的默认支付方式,请您查看支付方式是否正确。
400OrderError.NoRealNameAuthenticationYou have not completed the real name authentication.未完成实名验证,请您先进行实名认证后重试。
400OrderError.NoRealNameRegistrationReal name registration is required for instances launched in mainland China.国际站用户购买中国内地地域云产品,未完成实名注册。
400OrderError.UserProfileIncompleteYou have not completed your user profile.国际站用户未完善个人信息。
400InvalidVpcThe specified VPC is invalid.VPC信息无效,请您检查该参数是否正确。
400InvalidVolumeThe specified volume is invalid.存储卷无效,请您检查该参数是否正确。
400InvalidSoftwareThe specified software is not supported.请求的软件不支持
400InvalidVolumeProtocalThe specified volume protocol is invalid.存储协议无效,请您检查该参数是否正确。
400InvalidVolumeMountpointThe specified volume mount point is invalid.挂载点无效,请您检查该参数是否正确。
403TooManyClustersThe number of user clusters exceeds the quota.用户集群数量超过配额限制,如需更多,请参考产品使用限制文档的方式提升配额。
403TooManyComputesThe number of computing nodes exceeds the quota.计算节点数超过用户配额
403TooManyLoginsThe maximum number of logged on nodes is exceeded.登录节点数超过配额,默认不超过2个。如需更多,请参考使用限制文档中的提升配额方式。
403TooManySccThe maximum number of SCC instances is exceeded.SCC实例数量超过配额,默认不超过15个。如需更多,请参考使用限制文档中的提升配额方式。
403QuotaExceeded.PrivateIpAddressInsufficient private IP addresses in vSwitch: %s.vSwitch可用私网IP不足量: %s
403ConflictOptA conflicting operation is running.有冲突的操作在执行中,请您稍后再试。
403ImageNotSupportedThe specified image is not supported.暂不支持所选的镜像,请您更换镜像后重试。
404ImageNotFoundThe specified image does not exist.指定的镜像不存在,请您检查该参数是否正确。
404VolumeNotFoundThe specified volume does not exist.指定的存储不存在,请您检查该参数是否正确。
404VpcNotFoundThe specified VPC does not exist.指定的VPC不存在,请您检查该参数是否正确。
404ClusterNotFoundThe specified cluster does not exist.指定的集群不存在,请您检查该参数是否正确。
406EcsErrorAn error occurred while calling the ECS API operation.ECS API调用出错
406NasErrorNAS API request failed.NAS接口请求失败
406EipErrorThe EIP API request failed.请求弹性IP失败
406OrderErrorAn order request error occurred.订单请求失败
406FailToGenIdGenerating cluster ID failed.生成集群ID失败,请您再重试该操作。
406DbErrorA database service error occurred.数据库请求失败
406AliyunErrorAn Alibaba Cloud product error occurred.阿里云产品错误
407NotAuthorizedYou are not authorized by RAM for this request.此请求未获得RAM授权
500UnknownErrorAn unknown error occurred.未知错误
503ServiceUnavailableThe request has failed due to a temporary failure of the server请求失败,服务暂时不可用

访问错误中心查看更多错误码。