快速入门(PAI-DSW)

NAS与阿里云人工智能平台PAI(Platform For AI)无缝集成,您可以在PAI的服务上配置NAS作为数据集持久化存储部署、训练过程中的数据。本文介绍如何在控制台为PAI-DSW实例快速部署NAS。

前提条件

步骤一:创建文件系统

如果您已创建文件系统,请跳转至下一个步骤。

  1. 登录NAS控制台

  2. 概览页面的文件系统选型区域,单击通用型NAS下方的创建

  3. 创建面板,配置以下参数。

    参数

    说明

    地域

    必须与待挂载文件系统的服务在同一地域。本教程以华东1(杭州)地域为例。

    可用区

    请务必选择交换机所在的可用区,避免跨可用区产生时延。本教程以华东1可用区G为例。

    存储规格

    容量型

    协议类型

    NFS

    回收站

    建议启用,开启回收站后,被删除的文件或目录将暂存在回收站中,有效避免误删。

    生命周期管理

    请根据业务场景按需配置。建议不启用。

    加密类型

    不加密。

    数据备份

    不启用。

    挂载点类型

    专有网络。

    专有网络VPC

    在下拉框中选择已创建的VPC。

    虚拟交换机

    选择VPC下创建的交换机。

  4. 单击立即购买,根据页面提示,完成购买。

步骤二:创建DSW实例

本文以在公共资源组创建DSW实例为例,介绍如何将NAS配置为数据集使用。

  1. 登录PAI控制台

  2. 概览页面选择目标地域。

  3. 在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。

  4. 在工作空间页面的左侧导航栏选择模型开发与训练>交互式建模(DSW),进入DSW页面。

  5. 单击创建实例

  6. 配置实例向导页面,配置以下关键参数。其他参数取默认配置即可。更多详细内容,请参见创建DSW实例

    参数

    描述

    地域及可用区

    本教程选择:华东1(杭州)

    实例名称

    您可以自定义实例名称,本教程示例为:test_01。

    资源类型

    本教程选择:GPU规格,规格名称为ecs.gn7i-c8g1.2xlarge

    存储配置

    在共享数据集模块单击创建数据集,在弹出的从阿里云云产品创建数据集面板中配置以下重点参数,其他参数可保持默认值。更多关于数据集的信息,请参见创建及管理数据集

    • 选择数据存储:选择阿里云文件存储(NAS)

    • 选择NAS文件系统:在下拉框中选择类型为NAS的文件系统。选择上述步骤中已创建的NAS文件系统。

    选择镜像

    本文示例,选择官方镜像中的stable-diffusion-webui-develop:1.0.0-pytorch2.01-gpu-py310-cu117-ubuntu22.04

  7. 确认订单配置向导页面,确认所选配置,勾选服务协议,单击创建实例

    DSW实例创建需要等待大约10分钟,DSW实例创建成功,且状态为运行中

步骤三:验证挂载

  1. 返回DSW页面,单击刚创建的DSW实例操作列的打开

  2. DSW实例页面的顶部菜单栏中,单击Terminal页签。然后按照操作指引打开Terminal。

  3. Terminal中,输入以下命令,查看NAS数据集是否挂载成功。

    mount | grep nas

    系统输出如下返回结果,说明数据集已成功挂载。

    image.png

    其中,/mnt/data即为创建DSW实例时指定的挂载路径,后续只要您的NAS盘和服务正常运行,数据和代码就可以持久化存储。

相关文档