SetSchedulerInfo - 设置调度器信息

为指定集群设置调度器配置信息。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。
  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:
    • 对于必选的资源类型,用前面加 * 表示。
    • 对于不支持资源级授权的操作,用全部资源表示。
  • 条件关键字:是指云产品自身定义的条件关键字。
  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作访问级别资源类型条件关键字关联操作
ehpc:SetSchedulerInfoupdate
*全部资源
*

请求参数

名称类型必填描述示例值
RegionIdstring

地域 ID。

您可以通过调用 ListRegions 获取 E-HPC 支持的地域 ID。

cn-hangzhou
ClusterIdstring

集群 ID。

您可以通过调用 ListClusters 获取集群 ID。

ehpc-hz-FYUr32****
PbsInfoarray<object>

PBS 调度器信息列表。

object

PBS 调度器信息数组。

AclLimitarray<object>

队列限制信息列表。

object

队列限制信息数组。

Queuestring

AclLimit 指用户使用的队列限制。N 的取值范围:0~100。

假设PbsInfo.N.AclLimit.N.Queue设置为workqPbsInfo.N.AclLimit.N.AclUsers设置为user1,user2,表示队列 workq 只能被 user1 和 user2 使用。

workq
AclUsersstring

限制该队列使用的用户名,多个用户用,隔开。

当设置了用户名时,PbsInfo.N.AclLimit.N.Queue 为必选。

user1,user2
ResourceLimitarray<object>

集群用户使用的节点信息列表。

object

节点信息数组。

Nodesinteger

集群用户使用队列的最大节点个数。

2
Cpusinteger

集群用户使用队列中节点的最大 vCPU 个数。

2
Userstring

运行作业的集群用户名。

user1
Queuestring

PbsInfo 指集群中可以设置的 PBS 调度信息个数。N 的取值范围:0~100。

ResourceLimit 指用户使用的队列资源限制。N 的取值范围:0~100。

Queue 指该集群用户运行作业使用的队列名称。

当 ResourceLimit 中设置了 User、Cpus、Nodes、Mem 中任一一个参数时,Queue 为必选。

workq
Memstring

集群用户使用队列的最大内存资源。单位取值范围:

  • gb

  • mb

  • kb

2gb
MaxJobsinteger

集群用户提交的最大作业数目。若用户的运行和排队作业数目总和超过此数值则将无法再继续提交作业。

1000
JobHistoryDurationinteger

作业保留时间,超过保留之间后,作业数据会被销毁。单位为天。
取值范围:1~30。
默认值:14。

14
SchedIntervalinteger

PbsInfo 指集群中可以设置的 PBS 调度信息个数。N 的取值范围:0~100。

SchedInterval 指调度周期,单位:秒

调度周期指运行多个作业之间时间间隔,如设置为 60,表示本次作业开始运行 60 秒后才能开始运行下次作业。

默认值:60

60
SchedMaxJobsinteger

集群调度的最大作业数。若集群排队和运行的作业数总和超过此数值则无法再继续提交作业。默认值:20000

20000
SchedMaxQueuedJobsinteger

集群调度的最大排队作业数。若集群排队作业数量超过此数值则无法再继续提交作业。默认值:10000

10000
SlurmInfoarray<object>

Slurm 调度器信息列表。

object

Slurm 调度器信息数组。

BackfillIntervalinteger

Backfill 调度周期设置,单位:秒

默认值:60

60
SchedIntervalinteger

SlurmInfo 指集群中可以设置的 Slurm 调度信息个数。N 的取值范围:0~100。

SchedInterval 指主调度周期设置,单位:秒

默认值:60

60
Schedulerarray<object>

调度器信息列表。

object

调度器信息数组。

SchedNamestring

调度器名,取值范围:

  • pbs
  • pbs19
  • slurm
  • slurm19
  • slurm20
说明 调度器为 pbs、pbs19 时,PbsInfo.N.SchedInterval、PbsInfo.N.JobHistoryDuration、PbsInfo.N.ResourceLimit、PbsInfo.N.AclLimit 中至少一个参数为必选;调度器为 slurm、slurm19、slurm20 时,SlurmInfo.N.SchedInterval、SlurmInfo.N.BackfillInterval 中至少一个参数为必选。
pbs

返回参数

名称类型描述示例值
object
Messagestring

返回消息。

pbs: scheduler setting successfully.
RequestIdstring

请求 ID。

BBC2F93D-003A-49C4-850C-B826EECF****

示例

正常返回示例

JSON格式

{
  "Message": "pbs: scheduler setting successfully.",
  "RequestId": "BBC2F93D-003A-49C4-850C-B826EECF****"
}

错误码

HTTP status code错误码错误信息描述
400InvalidParamsThe specified parameter %s is invalid.指定的参数 %s 无效。
404ClusterNotFoundThe target cluster is not found.目标集群不存在
406AliyunErrorAn Alibaba Cloud product error occurred.阿里云产品错误。%s
406DbErrorA database service error occurred.数据库请求失败
406EcsErrorAn error occurred while calling the ECS API operation.ECS API调用出错. %s
407NotAuthorizedNo authorization is granted.未授权
500UnknownErrorAn unknown error occurred.未知错误
503ServiceUnavailableThe request has failed due to a temporary failure of the server请求失败,服务暂时不可用

访问错误中心查看更多错误码。