创建资源配额

更新时间:
复制为 MD 格式

购买灵骏智算资源或通用计算资源后,您需要创建资源配额以实现资源的分层管理和隔离使用。通过资源配额,您可以控制不同团队或项目的资源使用上限,并将配额绑定到工作空间用于AI开发和服务推理。

前提条件

创建资源配额前,请完成以下准备工作:

新增资源配额

PAI支持创建两种类型的资源配额:灵骏智算资源配额(需配置VPC、交换机、安全组)和通用计算资源配额(无需配置网络)。

创建资源配额时,您可以选择从资源池的专有资源组分配资源(创建根节点配额),或从已有的资源配额中分配资源(创建子级配额)。

重要

灵骏智算资源:多个节点必须使用相同的hz编号,以确保节点间高速网络互联。

具体操作步骤如下:

  1. 登录并进入PAI控制台的AI计算资源 > 资源配额页面。

  2. 灵骏智算资源通用计算资源页签中,单击新增资源配额

  3. 配置基本信息:

    • 名称:根据界面提示设置资源配额的名称。

    • 关联工作空间(可选):选择所属工作空间后,该资源配额将与工作空间绑定,您可以在该工作空间中使用资源配额。

      说明

      如果暂不关联工作空间,后续可在资源配额详情页面进行绑定。

  4. 配置配额资源信息:

    1. 选择来源类型,支持以下两种来源类型:

      • 专有资源组:选择资源池中的资源组,系统将从该资源组中分配资源,创建的资源配额为根节点资源配额。

      • 已有资源配额:从已有的资源配额中分配资源,创建子级资源配额。

      关于父子级资源配额的关系,请参见资源配额(Quota)

    2. 在下拉框中选择已创建的专有资源组或资源配额。

    3. 单击添加,从已有的资源配额或专有资源组中选择节点/规格

  5. 配置调度信息:

    • 调度策略:选择合适的调度策略,提高算力资源的利用率,支持以下策略:

      • 智能策略

      • 均衡策略

      • 遍历策略

      • FIFO策略

      关于各个调度策略的原理介绍,请参见调度策略

    • 子级算力抢占(可选):开启后,当资源紧张时,允许当前资源配额上的排队任务抢占子级上已运行的任务。详情请参见开启子级算力抢占

    • 本级算力抢占(可选):开启后,当资源紧张时,允许当前资源配额上的排队任务抢占同级已运行的任务。详情请参见开启本级算力抢占

    • 闲时共享:默认开启,表示同级和子级Quota的资源可以被闲时任务使用。

  6. (仅灵骏智算资源配额需要)配置网络信息:

    配置网络信息,确保资源配额中的实例可以访问指定的VPC网络资源。

    • 专有网络:选择已创建的专有网络。

    • 安全组:选择已创建的安全组。

    • 交换机:选择已创建的交换机。

    • 默认公网网关(可选):如果您有访问公网的需求,可以打开此开关,并选择NAT网关弹性公网IP

  7. 单击确定

    创建成功后,您可以在资源配额列表中查看新创建的资源配额。

image

使用资源配额

创建资源配额后,您需要将其绑定到工作空间,然后选择合适的镜像进行AI开发和服务推理。

绑定工作空间

只有将资源配额绑定到工作空间后,才能在该工作空间中使用配额进行AI开发和服务推理。具体操作步骤如下:

说明

如果在创建资源配额时,已关联工作空间,可忽略该操作。

  1. 资源配额(Quota)页面,单击资源配额名称。

  2. 概览页签的基础信息区域,单击工作空间后的image,为该资源配额添加或修改工作空间。image

将资源配额绑定到工作空间后,您还可以在该工作空间详情页面的调度配置中,配置资源配额使用策略,详情请参见工作空间调度中心image

镜像选择

使用PAI灵骏资源配额进行分布式训练(DLC)时,涉及服务器、网络、驱动、训练框架等软硬件的协同,因此建议您直接使用PAI官方镜像, 或基于PAI官方镜像构建镜像。

说明

使用您自有的镜像时,可能需要额外进行驱动、框架、软件版本的适配,才能充分应用灵骏智算资源的高性能。