管理资源配额

您可以对已创建的资源配额进行管理操作,包括新增父子级资源配额、扩缩容资源配额、查看资源配额列表及详情等。

创建父子Quota

资源配额页面,参考以下操作创建父、子级资源配额。创建完成后,资源配额将形成树形结构(简称QuotaTree),从而实现更灵活和精细的资源管理和分配。关于父子级关系图介绍,请参见功能介绍

  • 创建父级资源配额:单击新增资源配额,创建根资源配额。详情请参见云原生资源配额

  • 创建子级资源配额:通过新增资源配额,或在已有资源配额操作列下,单击新增子级资源配额,为资源配额新增子级资源配额。

image

Quota扩缩容

资源配额创建完成后,您可以根据任务需求调整其规模,以实现有效的成本管理。image

资源配额(Quota)页面中,单击目标资源配额操作列下的扩缩容,通过调整来源节点/规格实现资源配额的扩缩容。

  • 扩容:新增或调整资源的来源或规格,为资源配额增加可用资源。

  • 缩容:减少已关联资源规格的节点数或删除某些资源规格,释放闲置资源。

image

查看Quota列表

资源配额页面中,切换到灵骏智算资源通用计算资源页签,分别查看已创建的资源配额列表。image

列表展示资源配额的基础信息,包括名称、类型、所属工作空间、状态以及资源量(包括GPU卡数、CPU核数、内存)等信息。您可以执行以下操作:

  • 筛选资源配额:支持通过名称/ID状态过滤资源配额。

  • 按资源量排序:支持查看资源调度量和总量,并按CPU、内存或GPU的资源总量和调度量进行排序,以了解资源分布和使用情况。

查看Quota详情

资源配额页面,切换到灵骏智算资源通用计算资源页签,单击资源配额名称查看详情。支持从以下维度查看资源配额详情并并进行配置变更:

概览

image

在资源配额详情页面,切换到概览页签查看并更新相关配置:

  • 基本信息:包括资源配额名称、ID以及所属工作空间等。

    • 单击image按钮,更新资源配额名称归属的工作空间以及标签等。

    • 绑定工作空间后,单击工作空间名称即可跳转至详情页面,并在工作空间中使用该资源配额进行AI开发。

  • 资源信息:包括资源配额所属的资源组、父级资源配额及子级资源配额等信息。如需了解父子级资源配额的区别及其关系,请参见创建父子Quota章节中的关系图。单击相应资源名称,可跳转至目标页面查看详情。

  • 网络信息:用于展示与网络资源相关的配额限制,包括专有网络、安全组、NAT网关等。通过配置网络信息来控制资源配额在网络层面的使用范围,确保资源分配的合理性和安全性。

  • 调度信息:用于展示与资源配额相关的调度信息,并支持在该页面进行配置更新。

    • 调度策略:根据调度策略的实现原理选择合适的调度策略,提高出队效率和算力资源的利用率。如何配置调度策略,请参见调度策略

    • 子级算力抢占 & 本级算力抢占:在资源紧张时,允许当前资源配额上的排队任务抢占子级或本级资源配额上已运行的任务。关于本级与子级资源配额的关系以及抢占策略的配置方法,请参见抢占策略

    • 闲时共享:默认开启,表示本级和子级Quota的资源可以被闲时任务使用。

  • 资源变更历史:支持查看新建、扩缩容及删除的操作记录。记录中将展示变更类型、发起人、状态及变更的目标规格等详细信息。

  • 高级信息

    • 本地缓存:灵骏智算资源配额可以打开该开关,使用节点本地盘数据缓存功能,其能够有效减少重复数据传输的开销。详情请参见灵骏智算本地缓存加速

节点

image

在资源配额详情页面,切换到节点页签,查看和管理资源配额的节点信息:

  • 节点详情:包括节点规格所属专有资源组名称资源占用量和总量(包括GPU卡型、GPU卡数、CPU核数等),以及使用节点创建的任务数实例数等。

    • 任务和实例详情:在目标节点任务数实例数列,单击相应的数字,即可查看具体的任务和实例详情。

    • 筛选节点:支持按节点状态或订单状态进行筛选,也可按资源量进行排序。

  • 节点状态:相关状态说明如下:

    • 已就绪:表示算力节点可用。

    • 未就绪: 表示算力节点正在进行初始化等操作。

    • 禁止调度: 表示节点目前无法调度。具体原因如下:

      • 用户停止调度:用户手动操作停止调度, 节点无法使用。

      • 已过期:节点订单到期,无法使用。

      • 自愈中:节点自愈过程中,如果该节点上存在正在运行的任务,请及时停止,以保障节点自愈的正常推进。

      • 未知:其他原因,请联系您的商务经理。

  • 管理节点:

    • 停止/启动调度节点:单击目标节点操作列下的停止调度启动调度,即可暂停或启用该节点的资源使用。

    • 清空节点:单击目标节点操作列下的清空节点,即可清空该节点上创建的任务(包括DSW、DLCEAS)。

任务

image

在资源配额详情页面,切换到任务页签,查看Quota任务信息,页面展示排队中已出队两类任务的资源使用情况,包括任务状态、使用的资源配额、实例信息、GPU卡数、CPU核数及内存大小等关键指标。

  • 过滤任务:支持按类型任务状态进行过滤。

  • 查看详情:单击相应的任务名称、资源配额名称或工作空间名称,可跳转至目标页面查看详情。

  • 筛选当前资源配额任务:打开只看当前资源配额开关,可筛选出使用当前资源配额创建的任务。

用户

image

在资源配额详情页面,切换到用户页签,查看Quota内用户的资源使用情况,包括GPU卡数、CPU核数、内存大小及任务量等关键指标。

  • 筛选当前资源配额用户:打开只看当前资源配额的用户开关,只查看提交任务到当前资源配额的用户,不包括提交任务到子级资源配额的用户。

  • 查看任务详情:单击目标用户任务数列下的详情,查看该用户提交的任务。您也可以在任务信息页面单击任务名称,跳转到目标任务页面查看详情。

监控

在资源配额详情页面,切换到监控页签,查看Quota的监控信息。

  • 支持展示GPU算力热力图(实时使用率)、资源水位和任务状态分布情况。image

  • 支持从Quota和节点两个维度查看监控信息,涵盖CPU、内存、磁盘、网络以及GPU的监控指标。关于监控指标的详细说明,以及如何通过云监控ARMS,查看监控数据、配置监控报警通知、订阅监控指标,请参见资源配额监控与报警image

拓扑

在资源配额详情页面,切换到拓扑页签,查看Quota的拓扑信息,支持以下两种资源拓扑结构展示:

  • 资源视图:展示本级及子级资源配额在CPU、内存与GPU资源上的分配情况。image

  • 任务视图:展示通过本级及子级资源配额创建的总任务数,以及每种任务状态下的任务数量。image

删除Quota

您可以在资源配额(Quota)页面,单击操作列下的删除,移除不再使用的资源配额。若该资源配额已被工作空间绑定,请先解除绑定,再进行删除,详情请参见概览

image