基于不同的资源组,PAI-DLC支持公共资源组和专有资源组工作集群。本文为您介绍如何在PAI-DLC中准备适合自己的工作集群。

前提条件

  • 如果您使用公共资源组,则需要为PAI-DLC服务关联角色授权,详情请参见授权
  • 如果您使用专有资源组,则需要准备如下工作:

背景信息

  • 公共资源组按照任务实际时长计费,您无需自行维护计算资源集群,只需要明确任务需要使用的资源类型即可。关于资源类型和定价,请参见PAI-DLC计费说明
  • 专有资源组不额外计费,您只需要支付底层ACK计算资源和相关网络组件的费用。关于如何创建ACK集群,详情请参见创建Kubernetes专有版集群

准备公共资源组工作集群

  1. 登录PAI控制台
  2. 在左侧导航栏,选择模型开发和训练 > 云原生深度学习训练(DLC)
  3. 在PAI-DLC管理控制台页面,如果看到系统自动创建的公共资源组集群(如下图所示),则表明集群准备完毕。
    公共资源组集群如果在PAI-DLC管理控制台页面,没有看到系统自动创建的公共资源组集群,请提工单工单系统

准备专有资源组工作集群

  1. 登录PAI控制台
  2. 在左侧导航栏,选择模型开发和训练 > 云原生深度学习训练(DLC)
  3. 在PAI-DLC管理控制台页面,单击添加集群
  4. 添加集群面板,配置参数。
    参数 描述
    集群名称 PAI-DLC集群名称。长度为1~30个字符,以小写字母、大写字母、数字或中文开头,可以包含下划线(_)或短划线(-)。
    描述内容 PAI-DLC添加的ACK集群信息,便于区分不同的集群。
    ACK集群 PAI-DLC支持以下方式添加ACK集群:
    • ACK集群列表,选择已有的可绑定的ACK集群
    • 单击ACK集群后的新建集群,进入ACK管理控制台,新建ACK集群,详情请参见创建Kubernetes专有版集群
    组件版本 PAI-DLC组件的版本。
  5. 单击确定
    新添加的集群会显示在PAI-DLC管理控制台页面的集群列表下。如果该集群的状态部署中变为运行中,则可以开始深度学习训练。