本文介绍E-HPC Instant资源调度管理功能,包括调度策略和资源池的创建与管理操作。
功能概述
资源调度管理是E-HPC Instant的核心功能模块,用于精细化调度和管理计算资源。您可以通过创建调度策略与资源池,实现资源分配、优先级控制和用量限制,确保各业务作业高效、有序地获取计算资源。
资源调度管理功能包含两个核心子模块:调度策略和资源池。
调度策略定义资源分配规则和作业排队机制。当作业或执行节点超过配额限制,或指定资源库存不足时,作业将排队等待配额释放或库存恢复。
资源池是计算节点的逻辑分组和配额管理单元。每个资源池可关联一个调度策略,并设定独立的执行节点用量上限。若资源池未关联调度策略,作业在超出配额或库存不足时不会排队。
调度策略管理
调度策略定义作业获取计算资源的分配规则,包括资源分配方式和排队处理机制。排队作业默认按先入先出顺序出队。每个资源池可关联一个调度策略,策略在资源池层面统一生效。
调度策略列表
在调度策略标签页中,您可以查看当前地域下所有已创建的调度策略。列表展示以下信息:
字段名称 | 说明 |
调度策略名称 | 显示策略ID和自定义的策略名称。策略ID由系统自动生成,格式为 |
创建时间 | 该调度策略的创建时间,精确到秒。 |
操作 | 支持查看策略详情、编辑策略配置、删除策略。已关联资源池的策略不可删除。 |
创建调度策略
创建调度策略的操作步骤如下:
在调度策略标签页中,单击创建调度策略。
填写调度策略名称(必填),名称用于标识该策略的用途。
选择分配策略类型(详见下文说明)。
设置排队超时时间(详见下文说明)。
单击创建完成创建。
配置参数说明
参数 | 是否必填 | 说明 |
调度策略名称 | 是 | 自定义策略名称,用于标识和区分不同的调度策略。 |
分配策略 | 是 | 资源分配方式,可选库存均衡策略或实例规格按序策略。 |
排队超时时间 | 是 | 作业在队列中等待资源的最大时长。超时未获取资源的作业将自动终止。支持快捷设置1分钟、15分钟、1小时、6小时、1天、7天,也可自定义输入。 |
分配策略类型说明
E-HPC Instant提供两种资源分配策略,适用于不同的业务场景:
库存均衡策略
库存均衡策略综合评估各可用区的资源库存,将作业调度到库存最充裕的可用区执行,最大化资源获取成功率。适用于对实例规格无严格要求、希望尽快获取资源的通用批量计算场景。
实例规格按序策略
实例规格按序策略按照作业中指定的实例规格优先级顺序,依次尝试获取计算资源。若首选规格库存不足,自动尝试下一个规格。适用于对实例规格有偏好、需在性能和成本间精细控制的场景。该策略仅对标准调度指定实例规格类型作业生效。
查看调度策略详情
在调度策略列表中,单击查看或策略ID链接,进入策略详情页面。详情页展示以下信息:
字段 | 说明 |
调度策略名称 | 用户自定义的策略名称。 |
调度策略ID | 系统自动生成的唯一标识符。 |
创建时间 | 策略的创建时间。 |
资源分配策略 | 当前生效的分配策略类型(库存均衡策略/实例规格按序策略)。 |
排队作业超时时间 | 当前设置的排队超时时长。 |
编辑调度策略
若需修改已创建的调度策略,请执行以下操作:
在调度策略列表中,找到目标策略,单击对应行的编辑。
在编辑页面中修改分配策略类型或排队超时时间。
单击确认保存修改。修改后的配置将对关联的资源池即时生效。
删除调度策略
删除调度策略前请确认:
该策略未被任何资源池关联。如已关联,请先修改资源池的调度策略或删除资源池,再删除该策略。
删除操作不可恢复,请谨慎操作。
在调度策略列表中,单击目标策略对应行的删除,在弹出的确认对话框中确认后即可完成删除。
资源池管理
资源池是计算节点逻辑分组和配额管理的核心单元。您可以创建多个资源池,将不同业务的计算作业隔离到独立的资源空间。每个资源池可独立设置执行节点上限、优先级和调度策略,实现精细化资源管控。
资源池列表
在资源池标签页中,您可以查看当前地域下所有已创建的资源池。列表展示以下信息:
字段名称 | 说明 |
资源池名称 | 自定义的资源池名称,也是资源池的唯一标识。 |
状态 | 资源池当前状态,包括:工作中(正常运行)、创建中(正在初始化)、更新中(配置变更中)。 |
是否默认 | 标记是否为默认资源池。未指定资源池的作业自动分配到默认资源池。 |
优先级 | 资源池的优先级,数值越小优先级越高。多个资源池竞争资源时,高优先级资源池优先获取资源。 |
执行节点限制 | 该资源池可同时使用的最大执行节点数量上限。 |
创建时间 | 资源池的创建时间。 |
操作 | 支持查看资源池详情、编辑资源池配置、删除资源池。 |
列表支持按资源池名称搜索筛选,便于快速定位。
创建资源池
创建资源池的操作步骤如下:
在资源池标签页中,单击创建资源池。
填写资源池名称(必填)。
设置优先级(必填),数值越小优先级越高,默认值为1。
设置执行节点限制(必填),即该资源池可使用的最大执行节点数。
从下拉列表中选择关联的调度策略(必填)。
单击创建完成创建。创建成功后,资源池状态将变为创建中,初始化完成后自动转为工作中。
配置参数说明
参数 | 是否必填 | 说明 |
资源池名称 | 是 | 自定义资源池名称,用于唯一标识该资源池。 |
优先级 | 是 | 资源池的调度优先级。数值越小表示优先级越高。默认值为1。 |
执行节点限制 | 是 | 该资源池可同时使用的最大执行节点数量,即资源配额上限。 |
调度策略 | 是 | 从已创建的调度策略中选择一个关联。调度策略决定该资源池内作业获取资源的方式。 |
查看资源池详情
在资源池列表中,单击查看或资源池名称链接,进入资源池详情页面。详情页展示以下内容:
基本信息
字段 | 说明 |
资源池名称 | 资源池的名称。 |
状态 | 资源池当前运行状态。 |
创建时间 | 资源池创建的时间。 |
是否默认 | 该资源池是否被设置为默认资源池。 |
优先级 | 资源池的调度优先级数值。 |
最后更新时间 | 资源池配置最近一次变更的时间。 |
调度策略 | 当前关联的调度策略ID,单击可跳转至策略详情页。 |
执行节点用量
详情页以可视化方式展示资源池的执行节点使用情况,包括以下指标:
指标 | 说明 |
当前用量 | 资源池中当前正在使用的执行节点数量。 |
最大限制 | 资源池配置的执行节点数量上限。 |
可用数量 | 资源池中剩余可用的执行节点数量(最大限制 - 当前用量)。 |
使用率 | 当前用量占最大限制的百分比,反映资源池的使用负荷。 |
编辑资源池
若需修改资源池的配置,请执行以下操作:
在资源池列表或详情页中,单击编辑。
修改需要调整的配置项(优先级、执行节点限制、调度策略等)。
单击确认保存修改。修改生效期间,资源池状态将短暂变为更新中,更新完成后恢复为工作中。
编辑期间,已运行的作业不受影响。新配置仅对后续提交的作业生效。
删除资源池
在资源池列表中,单击目标资源池对应行的删除,确认后完成删除。删除不可恢复,请先确保资源池中无运行中的作业。默认资源池不支持删除。
最佳实践
多业务场景的资源隔离
多个业务线同时使用E-HPC Instant时,建议为每条业务线创建独立资源池,按业务重要性设置优先级。例如,生产任务使用高优先级(优先级 = 1)资源池,测试任务使用低优先级(优先级 = 10)资源池。通过执行节点限制合理分配配额,防止单个业务线过度占用资源。
合理设置排队超时时间
排队超时时间应结合业务时效性要求设置。短作业时效性要求高,建议设置较短超时(如15分钟或1小时),使作业快速获取资源或及时失败以便重试。大规模批处理任务可容忍较长等待,建议设置较长超时(如1天或7天),提高资源获取成功率。
选择合适的分配策略
大多数批量计算场景推荐使用库存均衡策略,自动选择资源充足的可用区,提高调度成功率。若业务对实例规格有明确偏好(如特定GPU型号或内存配置),建议使用实例规格按序策略,按优先级顺序获取最合适的规格。