文档

管理资源配额

更新时间:

您可以对已创建的资源配额进行管理操作,包括查看资源配额详情、扩缩容资源配额以及新增子级资源配额等。

查看资源配额详情

  • 登录并进入PAI控制台的资源配额页面后,您可以切换灵骏智算资源和通用计算资源页签,查看已创建的资源配额。image

    • 支持通过名称、ID和工作空间ID过滤资源配额。

    • 支持按照CPU、内存及GPU的总量和调度量进行排序,以了解资源分布及使用情况。

    • 支持通过单击刷新按钮,查看最新的资源配额的状态、调度量和总量。

  • 单击相应的资源配额名称,以查看资源配额的详细信息。

    image

    • 支持查看资源配额用量明细,包括CPU调度量(核数)、内存调度量(TiB)和GPU调度量(卡数)。支持查看资源总量、本级资源消耗量及子级资源消耗量,全面覆盖资源使用情况。

    • 支持按照概览节点任务用户监控以及拓扑维度查看资源配额详情。

概览

在资源配额详情页面,您可以切换到概览页签,查看该资源配额的基础信息、资源信息、网络信息以及资源变更历史等内容。image

您还可以在指定区域完成以下变更配置:

  • 更新基础信息

    单击image按钮,更新资源配额名称、更新资源配额归属的工作空间、更新标签。绑定工作空间后,即可在该工作空间中使用该资源配额进行AI开发工作。您也可以在工作空间详情页面的调度中心中,为绑定到该工作空间中的资源配额,配置使用策略,包括资源使用模块配置、资源使用角色配置、资源使用卡配置以及资源规格模板配置等,详情请参见工作空间调度中心

  • 更新资源信息

    • 单击调度策略后的image按钮,修改调度策略,关于各个调度策略的原理介绍,请参见调度策略

    • 启用或关闭允许抢占子级算力功能。启用后,允许在当前资源配额中提交的任务抢占在子级资源配额中提交的DLC任务的计算资源。

  • 查看资源变更历史

    资源变更历史区域,您可以查看该资源配额的新建、扩缩容以及删除的操作记录。

节点

在资源配额详情页面,您可以切换到节点页签,查看该资源配额的节点规格。image

  • 管理节点

    您可以单击目标节点操作列下的停止调度来进行相应设置,设置停止调度后,将禁止新任务分配至该节点,有效暂停其资源使用。

  • 其他常用功能

    • 您可以在目标节点任务数实例数列,查看通过该节点创建的任务和实例总数。单击任务数和实例数列下的详情,即可查看具体的任务信息和实例信息。

    • 支持通过节点状态进行筛选,或通过单击image按钮实现排序。

任务

在资源配额详情页面,您可以切换到任务页签,查看使用本级资源配额和子级资源配额创建的任务。image

任务涵盖了使用本级资源配额及子级资源配额创建的任务。您可以打开仅显示当前资源配额参数,以查看仅由当前资源配额创建的任务。

用户

在资源配额详情页面,您可以切换到用户页签,查看创建本级资源配额和子级资源配额的用户。

image

您可以查看该用户的CPU、内存及GPU资源的提交量和调度量,也可以查看该用户提交的任务总数。单击任务数列下的详情,您可以获取更多有关任务的详细信息。

监控

在资源配额详情页面,您可以切换到监控页签,查看资源水位以及监控指标数据。image

  • 切换监控维度:目前支持Quota维度节点维度的监控指标展示。image

  • 切换展示时间范围:image

  • 设置每行显示的监控指标:image

您也可以为监控指标配置报警规则和报警通知,如果资源水位出现波动,则会发送报警通知。详情请参见资源配额监控与报警

拓扑

在资源配额详情页面,您可以切换至拓扑页签,查看资源视图和任务视图。您可以实时监控每个节点的资源使用状况及资源消耗情况,以便您合理调整资源分配策略,从而提高资源利用率。image

切换资源视图和任务视图:

  • 在资源视图中,您可以详细查看本级及子级资源配额在CPU、内存与GPU资源上的分配情况。

  • 在任务视图中,您可以查看通过本级及子级资源配额创建的总任务数,以及每种任务状态下的任务数量。

扩缩容资源配额

您可以针对当前任务量调整资源配额的规模,以实现有效的成本管理。在资源配额页面中,单击资源配额操作列下的扩缩容,通过调整来源规格/资源来实现资源配额的扩缩容。

  • 扩容:为资源配额新增资源,将资源池中不同的资源规格整合到同一个资源配额中。

  • 缩容:通过减少已关联的资源规格的节点数或删除某些资源规格来释放资源。

新增子级资源配额

通过新增子级资源配额,实现更精细的资源管理、优化分配策略,提高资源利用效率。

资源配额页面中,单击资源配额操作列下的新增子级资源配额,为资源配额新增子级资源配额,将资源按照树形结构进行划分。您可以将子级资源配额绑定到工作空间中,在工作空间中使用子级资源配额来进行AI开发。