资源调度管理

更新时间:
复制为 MD 格式

本文介绍E-HPC Instant资源调度管理功能,包括调度策略和资源池的创建与管理操作。

功能概述

资源调度管理是E-HPC Instant的核心功能模块,用于精细化调度和管理计算资源。您可以通过创建调度策略与资源池,实现资源分配、优先级控制和用量限制,确保各业务作业高效、有序地获取计算资源。

资源调度管理功能包含两个核心子模块:调度策略资源池

  • 调度策略定义资源分配规则和作业排队机制。当作业或执行节点超过配额限制,或指定资源库存不足时,作业将排队等待配额释放或库存恢复。

  • 资源池是计算节点的逻辑分组和配额管理单元。每个资源池可关联一个调度策略,并设定独立的执行节点用量上限。若资源池未关联调度策略,作业在超出配额或库存不足时不会排队。

调度策略管理

调度策略定义作业获取计算资源的分配规则,包括资源分配方式和排队处理机制。排队作业默认按先入先出顺序出队。每个资源池可关联一个调度策略,策略在资源池层面统一生效。

调度策略列表

调度策略标签页中,您可以查看当前地域下所有已创建的调度策略。列表展示以下信息:

字段名称

说明

调度策略名称

显示策略ID和自定义的策略名称。策略ID由系统自动生成,格式为policy-<随机字符串>

创建时间

该调度策略的创建时间,精确到秒。

操作

支持查看策略详情、编辑策略配置、删除策略。已关联资源池的策略不可删除。

创建调度策略

创建调度策略的操作步骤如下:

  1. 调度策略标签页中,单击创建调度策略

  2. 填写调度策略名称(必填),名称用于标识该策略的用途。

  3. 选择分配策略类型(详见下文说明)。

  4. 设置排队超时时间(详见下文说明)。

  5. 单击创建完成创建。

配置参数说明

参数

是否必填

说明

调度策略名称

自定义策略名称,用于标识和区分不同的调度策略。

分配策略

资源分配方式,可选库存均衡策略实例规格按序策略

排队超时时间

作业在队列中等待资源的最大时长。超时未获取资源的作业将自动终止。支持快捷设置1分钟、15分钟、1小时、6小时、1天、7天,也可自定义输入。

分配策略类型说明

E-HPC Instant提供两种资源分配策略,适用于不同的业务场景:

库存均衡策略

库存均衡策略综合评估各可用区的资源库存,将作业调度到库存最充裕的可用区执行,最大化资源获取成功率。适用于对实例规格无严格要求、希望尽快获取资源的通用批量计算场景。

实例规格按序策略

实例规格按序策略按照作业中指定的实例规格优先级顺序,依次尝试获取计算资源。若首选规格库存不足,自动尝试下一个规格。适用于对实例规格有偏好、需在性能和成本间精细控制的场景。该策略仅对标准调度指定实例规格类型作业生效。

查看调度策略详情

在调度策略列表中,单击查看或策略ID链接,进入策略详情页面。详情页展示以下信息:

字段

说明

调度策略名称

用户自定义的策略名称。

调度策略ID

系统自动生成的唯一标识符。

创建时间

策略的创建时间。

资源分配策略

当前生效的分配策略类型(库存均衡策略/实例规格按序策略)。

排队作业超时时间

当前设置的排队超时时长。

编辑调度策略

若需修改已创建的调度策略,请执行以下操作:

  1. 在调度策略列表中,找到目标策略,单击对应行的编辑

  2. 在编辑页面中修改分配策略类型或排队超时时间。

  3. 单击确认保存修改。修改后的配置将对关联的资源池即时生效。

删除调度策略

删除调度策略前请确认:

  • 该策略未被任何资源池关联。如已关联,请先修改资源池的调度策略或删除资源池,再删除该策略。

  • 删除操作不可恢复,请谨慎操作。

在调度策略列表中,单击目标策略对应行的删除,在弹出的确认对话框中确认后即可完成删除。

资源池管理

资源池是计算节点逻辑分组和配额管理的核心单元。您可以创建多个资源池,将不同业务的计算作业隔离到独立的资源空间。每个资源池可独立设置执行节点上限、优先级和调度策略,实现精细化资源管控。

资源池列表

资源池标签页中,您可以查看当前地域下所有已创建的资源池。列表展示以下信息:

字段名称

说明

资源池名称

自定义的资源池名称,也是资源池的唯一标识。

状态

资源池当前状态,包括:工作中(正常运行)、创建中(正在初始化)、更新中(配置变更中)。

是否默认

标记是否为默认资源池。未指定资源池的作业自动分配到默认资源池。

优先级

资源池的优先级,数值越小优先级越高。多个资源池竞争资源时,高优先级资源池优先获取资源。

执行节点限制

该资源池可同时使用的最大执行节点数量上限。

创建时间

资源池的创建时间。

操作

支持查看资源池详情、编辑资源池配置、删除资源池。

说明

列表支持按资源池名称搜索筛选,便于快速定位。

创建资源池

创建资源池的操作步骤如下:

  1. 资源池标签页中,单击创建资源池

  2. 填写资源池名称(必填)。

  3. 设置优先级(必填),数值越小优先级越高,默认值为1。

  4. 设置执行节点限制(必填),即该资源池可使用的最大执行节点数。

  5. 从下拉列表中选择关联的调度策略(必填)。

  6. 单击创建完成创建。创建成功后,资源池状态将变为创建中,初始化完成后自动转为工作中

配置参数说明

参数

是否必填

说明

资源池名称

自定义资源池名称,用于唯一标识该资源池。

优先级

资源池的调度优先级。数值越小表示优先级越高。默认值为1。

执行节点限制

该资源池可同时使用的最大执行节点数量,即资源配额上限。

调度策略

从已创建的调度策略中选择一个关联。调度策略决定该资源池内作业获取资源的方式。

查看资源池详情

在资源池列表中,单击查看或资源池名称链接,进入资源池详情页面。详情页展示以下内容:

基本信息

字段

说明

资源池名称

资源池的名称。

状态

资源池当前运行状态。

创建时间

资源池创建的时间。

是否默认

该资源池是否被设置为默认资源池。

优先级

资源池的调度优先级数值。

最后更新时间

资源池配置最近一次变更的时间。

调度策略

当前关联的调度策略ID,单击可跳转至策略详情页。

执行节点用量

详情页以可视化方式展示资源池的执行节点使用情况,包括以下指标:

指标

说明

当前用量

资源池中当前正在使用的执行节点数量。

最大限制

资源池配置的执行节点数量上限。

可用数量

资源池中剩余可用的执行节点数量(最大限制 - 当前用量)。

使用率

当前用量占最大限制的百分比,反映资源池的使用负荷。

编辑资源池

若需修改资源池的配置,请执行以下操作:

  1. 在资源池列表或详情页中,单击编辑

  2. 修改需要调整的配置项(优先级、执行节点限制、调度策略等)。

  3. 单击确认保存修改。修改生效期间,资源池状态将短暂变为更新中,更新完成后恢复为工作中

重要

编辑期间,已运行的作业不受影响。新配置仅对后续提交的作业生效。

删除资源池

在资源池列表中,单击目标资源池对应行的删除,确认后完成删除。删除不可恢复,请先确保资源池中无运行中的作业。默认资源池不支持删除。

最佳实践

多业务场景的资源隔离

多个业务线同时使用E-HPC Instant时,建议为每条业务线创建独立资源池,按业务重要性设置优先级。例如,生产任务使用高优先级(优先级 = 1)资源池,测试任务使用低优先级(优先级 = 10)资源池。通过执行节点限制合理分配配额,防止单个业务线过度占用资源。

合理设置排队超时时间

排队超时时间应结合业务时效性要求设置。短作业时效性要求高,建议设置较短超时(如15分钟或1小时),使作业快速获取资源或及时失败以便重试。大规模批处理任务可容忍较长等待,建议设置较长超时(如1天或7天),提高资源获取成功率。

选择合适的分配策略

大多数批量计算场景推荐使用库存均衡策略,自动选择资源充足的可用区,提高调度成功率。若业务对实例规格有明确偏好(如特定GPU型号或内存配置),建议使用实例规格按序策略,按优先级顺序获取最合适的规格。