为指定集群设置调度器配置信息。
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
授权信息
下表是API对应的授权信息,可以在RAM权限策略语句的Action
元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:
- 操作:是指具体的权限点。
- 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
- 资源类型:是指操作中支持授权的资源类型。具体说明如下:
- 对于必选的资源类型,用背景高亮的方式表示。
- 对于不支持资源级授权的操作,用
全部资源
表示。
- 条件关键字:是指云产品自身定义的条件关键字。
- 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作 | 访问级别 | 资源类型 | 条件关键字 | 关联操作 |
---|---|---|---|---|
ehpc:SetSchedulerInfo | Write |
|
| 无 |
请求参数
名称 | 类型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
RegionId | string | 是 | 地域 ID。 您可以通过调用 ListRegions 获取 E-HPC 支持的地域 ID。 | cn-hangzhou |
ClusterId | string | 是 | 集群 ID。 您可以通过调用 ListClusters 获取集群 ID。 | ehpc-hz-FYUr32**** |
PbsInfo | object [] | 否 | PBS 调度器信息列表。 | |
AclLimit | object [] | 否 | 队列限制信息列表。 | |
Queue | string | 否 | AclLimit 指用户使用的队列限制。N 的取值范围:0~100。 假设 | workq |
AclUsers | string | 否 | 限制该队列使用的用户名,多个用户用 当设置了用户名时,PbsInfo.N.AclLimit.N.Queue 为必选。 | user1,user2 |
ResourceLimit | object [] | 否 | 集群用户使用的节点信息列表。 | |
Nodes | integer | 否 | 集群用户使用队列的最大节点个数。 | 2 |
Cpus | integer | 否 | 集群用户使用队列中节点的最大 vCPU 个数。 | 2 |
User | string | 否 | 运行作业的集群用户名。 | user1 |
Queue | string | 否 | PbsInfo 指集群中可以设置的 PBS 调度信息个数。N 的取值范围:0~100。 ResourceLimit 指用户使用的队列资源限制。N 的取值范围:0~100。 Queue 指该集群用户运行作业使用的队列名称。 当 ResourceLimit 中设置了 User、Cpus、Nodes、Mem 中任一一个参数时,Queue 为必选。 | workq |
Mem | string | 否 | 集群用户使用队列的最大内存资源。单位取值范围:
| 2gb |
MaxJobs | integer | 否 | 集群用户提交的最大作业数目。若用户的运行和排队作业数目总和超过此数值则将无法再继续提交作业。 | 1000 |
JobHistoryDuration | integer | 否 | 作业保留时间,超过保留之间后,作业数据会被销毁。单位为天。 | 14 |
SchedInterval | integer | 否 | PbsInfo 指集群中可以设置的 PBS 调度信息个数。N 的取值范围:0~100。 SchedInterval 指调度周期,单位:秒 调度周期指运行多个作业之间时间间隔,如设置为 60,表示本次作业开始运行 60 秒后才能开始运行下次作业。 默认值:60 | 60 |
SchedMaxJobs | integer | 否 | 集群调度的最大作业数。若集群排队和运行的作业数总和超过此数值则无法再继续提交作业。默认值:20000 | 20000 |
SchedMaxQueuedJobs | integer | 否 | 集群调度的最大排队作业数。若集群排队作业数量超过此数值则无法再继续提交作业。默认值:10000 | 10000 |
SlurmInfo | object [] | 否 | Slurm 调度器信息列表。 | |
BackfillInterval | integer | 否 | Backfill 调度周期设置,单位:秒 默认值:60 | 60 |
SchedInterval | integer | 否 | SlurmInfo 指集群中可以设置的 Slurm 调度信息个数。N 的取值范围:0~100。 SchedInterval 指主调度周期设置,单位:秒 默认值:60 | 60 |
Scheduler | object [] | 是 | 调度器信息列表。 | |
SchedName | string | 是 | 调度器名,取值范围:
说明
调度器为 pbs、pbs19 时,PbsInfo.N.SchedInterval、PbsInfo.N.JobHistoryDuration、PbsInfo.N.ResourceLimit、PbsInfo.N.AclLimit 中至少一个参数为必选;调度器为 slurm、slurm19、slurm20 时,SlurmInfo.N.SchedInterval、SlurmInfo.N.BackfillInterval 中至少一个参数为必选。
| pbs |
返回参数
示例
正常返回示例
JSON
格式
{
"Message": "pbs: scheduler setting successfully.",
"RequestId": "BBC2F93D-003A-49C4-850C-B826EECF****"
}
错误码
HTTP status code | 错误码 | 错误信息 | 描述 |
---|---|---|---|
400 | InvalidParams | The specified parameter %s is invalid. | 无效的参数:%s |
404 | ClusterNotFound | The target cluster is not found. | 目标集群不存在 |
406 | AliyunError | An Alibaba Cloud product error occurred. | 阿里云产品错误 |
406 | DbError | A database service error occurred. | 数据库请求失败 |
406 | EcsError | An error occurred while calling the ECS API operation. | ECS API调用出错 |
407 | NotAuthorized | No authorization is granted. | 未授权 |
500 | UnknownError | An unknown error occurred. | 未知错误 |
503 | ServiceUnavailable | The request has failed due to a temporary failure of the server | 请求失败,服务暂时不可用 |
访问错误中心查看更多错误码。