在PAI中使用自持计算资源

更新时间:
复制 MD 格式

如果您已有阿里云容器服务(ACK)集群,可以将其接入PAI作为计算资源,用于DSW开发和DLC训练。

前置条件

请联系PDSA完成以下准备:

  • 已准备好可在PAI中使用的ACK集群。

  • 账号已完成白名单配置

配置自持计算资源

步骤一:新建资源组

首先在PAI中创建资源组,将其映射到指定的ACK集群。

  1. 登录PAI控制台,在左上角选择ACK集群所在地域。

  2. 在左侧导航栏,选择AI计算资源>资源池

  3. 切换到自持计算资源页签,单击新建资源组,在弹出的对话框中从下拉列表中选择已准备好的ACK集群。

步骤二:新增资源配额

创建资源组后,为其配置资源配额。配额定义了该资源组可被调度的资源总量上限,用于资源隔离和管理,不产生费用。

具体操作参见新增资源配额

资源配额(Quota)页面,单击自持计算资源页签,然后单击左上角的新增资源配额

使用自持计算资源

配置完成后,可在PAI的各产品模块中使用自持计算资源。

DSW实例中使用

资源信息区域,资源类型选择资源配额,然后下拉选择自持计算资源的资源配额。

选择后,资源概览区域显示GPU类型(如V100)及智能策略标签,下方规格表格列出配额的规格名称、节点总数、GPU卡型、GPU卡数、CPU核数和内存等信息。

DLC中使用

在创建DLC任务时,资源类型选择自持计算资源来源选择资源配额,然后下拉选择自持计算资源的资源配额。

选择后,界面将展示所选资源配额的规格信息,包括规格名称、GPU卡型、GPU卡数、CPU核数和内存等。

查看资源使用情况

概览资源概览页面可以查看自持资源的使用情况。

单击自持计算资源页签,即可查看自持计算资源的名称、状态、节点数、GPU卡数等信息。