调度策略

本文介绍了不同的调度策略及其实现原理,帮助您在配置资源配额时,提高出队效率和算力资源利用率。

背景信息

PAI 提交到资源配额(Quota)中的每个任务都有优先级,取值为1~9,数字越大表示优先级越高,数字越小表示优先级越低。当多个任务或实例同时请求算力资源时,会根据任务优先级形成一个队列并等待执行。

为了提高算力资源的使用效率,PAI在资源配额维度提供了多种排队策略,并通过调度策略来提高任务的出队效率。您可以在资源配额界面上配置和管理这些排队策略,选择不同的排队策略将直接影响任务的执行顺序,但不会影响已经开始执行的任务。

调度策略

配置资源配额时,支持选择以下几种类型的调度策略,各个调度策略的实现原理说明如下:

FIFO策略

如果队列中的第一个任务无法出队,系统将反复尝试对第一个任务进行出队操作,而不会跳过。

image

遍历策略

如果队列中的第一个任务无法出队,则会跳过该任务,然后依次尝试对后续队列中的任务进行出队操作。

image

均衡策略

  • 如果队列中的第一个任务无法出队,系统将反复尝试对第一个任务进行出队操作,不会跳过。

  • 如果第一个任务等待出队时间超过预定时间(一般为几分钟),则系统会按照遍历策略尝试对第一个任务和第二个任务进行出队操作。

  • 如果第二个任务等待出队时间也超过预定时间,系统会对第一个、第二个和第三个任务按照遍历策略尝试出队操作,依次类推。

image

智能策略

当调度策略选择智能策略时,系统将根据设定的任务优先级自动选择合适的执行策略:

  • 对于优先级在79之间的任务,则采用FIFO策略进行调度。

  • 对于优先级在16之间的任务,则采用遍历策略进行调度,并且这些任务在队列中的位置将随着排队时间的增加而逐步前移,最多可前移至6级任务的位置。

image

其中:Item1、Item2优先级≥7;Item3~ItemN优先级<7。

相关文档

在创建资源配额时,您可以根据调度策略实现原理选择合适的调度策略。具体操作,请参见资源配额(Quota)功能介绍