文档

新建资源组并购买灵骏智算资源

更新时间:

灵骏智算资源,作为阿里云PAI AI计算引擎的核心组成部分,提供了大规模且高密度的计算资源。它旨在满足高性能AI训练和计算的异构算力需求,支持DSW、DLC和EAS模块,助力您的AI开发、训练和服务部署操作。本文为您介绍如何创建资源组并购买灵骏智算资源。

功能简介

资源类型

灵骏智算类型的资源,是阿里云自主研发的新一代智能计算资源,提供:

  • RDMA高速网络架构

  • 高性能通信库

  • 高性能加速软件

  • GPU虚拟化的技术方案

可以更好地满足高性能算力需求。

资源组类型

阿里云PAI为您提供全托管的灵骏智算资源,您可在PAI产品控制台便捷地完成购买、使用的全流程,如果您已购买单独的灵骏硬件资源,也可将此类资源作为半托管的资源添加至PAI产品控制台,用于后续的训练任务使用。

使用限制

  • 支持使用的地域

    当前仅支持华北6(乌兰察布)新加坡地域。

  • 支持使用的用户

    当前灵骏智算资源仅供白名单用户受限申请使用,如果您希望使用灵骏智算资源提交训练任务,您可先提交工单,申请添加灵骏智算使用白名单。

  • 支持的任务类型

    当前灵骏智算资源仅支持TensorFlow、PyTorch、ElasticBatch和MPIJob类型的训练任务。

操作账号和权限要求

  • 阿里云主账号(推荐):使用主账号可完成所有操作,无需额外授权。

  • RAM用户:需要通过主账号为RAM用户授予管理资源池权限授予AliyunPAIFullAccess权限

    重要

    AliyunPAIFullAccess拥有管理和操作PAI所有资源和功能的权限,请谨慎授权。建议您直接使用主账号进行操作。

依赖的云产品

灵骏智算资源在创建、购买及后续使用的过程中,依赖以下其他云产品,您在购买使用前需先了解依赖的云产品,并根据实际需要提前准备好对应的云产品。

(必选)VPC

分配灵骏智算资源时,您需绑定一个同地域的VPC,并配置交换机与安全组信息,保障灵骏智算资源与各云产品的网络是连通状态。

(按需)公网NAT网关与EIP

如果后续您需要访问公网环境,例如使用公网环境下的自定义镜像等场景,您还需开通并配置公网NAT网关的SNAT功能,绑定EIP,实现灵骏智算资源访问公网的能力。

配置公网NAT网关的SNAT功能操作详情可参见使用公网NAT网关SNAT功能访问互联网

(按需)OSS/NAS/智算CPFS

您后续使用灵骏智算资源提交DLC任务时,需先创建数据集,当前支持使用OSS、NAS、智算CPFS类型的数据集,因此您需根据数据集的应用需要提前准备好OSS或NAS或智算CPFS资源,并创建好对应的数据集。详情请参见准备工作:准备数据集

新建资源组并购买灵骏智算资源

新建灵骏资源组

  1. 登录并进入PAI控制台的AI计算资源 > 资源池页面。

  2. 灵骏智算资源页签中,单击新建资源组

  3. 新建资源组对话框中配置以下参数,完成后单击确定

    参数

    说明

    类型

    选择专有资源组

    资源组名称

    根据界面提示设置满足规则的资源组名称。

购买灵骏智算资源

您可以按照以下操作步骤为专有资源组购买灵骏智算资源,关于灵骏智算资源的计费详情,请参见灵骏智算资源Serverless版计费说明

  1. 灵骏智算资源页签的资源组列表中,单击资源组名称。

  2. 在资源组详情页面右上方,单击新建订单

  3. 在购买页面中根据实际业务需要选择节点规格每一个订单中的节点数量购买时长等必要参数,完成后单击立即购买image

  4. 支付页面完成支付后,在订单列表页面中会展示已购买的灵骏智算资源列表。image

相关文档

资源组创建成功并购买计算资源后,您可以进行以下操作:

  • 在资源组页面查看资源组的基本信息,并对已购买的资源进行管理。具体操作,请参见管理资源

  • 通过配置资源配额,将这些资源分配给具体的训练任务。具体操作,请参见灵骏智算资源配额