快速入门(PAI-DSW)

NAS与阿里云人工智能平台PAI(Platform For AI)无缝集成,您可以在PAI的服务上配置NAS作为数据集持久化存储部署、训练过程中的数据。本文介绍如何在控制台为PAI-DSW实例快速部署NAS。

前提条件

步骤一:创建文件系统

如果您已创建文件系统,请跳转至下一个步骤。

  1. 登录NAS控制台

  2. 概览页面的文件系统选型区域,单击通用型NAS下方的创建

  3. 创建面板,配置以下参数。

    参数

    说明

    地域

    必须与待挂载文件系统的服务在同一地域。本教程以华东1(杭州)地域为例。

    可用区

    请务必选择交换机所在的可用区,避免跨可用区产生时延。本教程以华东1可用区F为例。

    存储规格

    高级型

    协议类型

    NFS

    回收站

    建议启用,开启回收站后,被删除的文件或目录将暂存在回收站中,有效避免误删。

    生命周期管理

    请根据业务场景按需配置。建议不启用。

    加密类型

    不加密。

    数据备份

    不启用。

    挂载点类型

    专有网络。

    专有网络VPC

    在下拉框中选择已创建的VPC。

    虚拟交换机

    选择VPC下创建的交换机。

  4. 单击立即购买,根据页面提示,完成购买。

步骤二:创建DSW实例

本文以在公共资源组创建DSW实例为例,介绍如何将NAS配置为数据集使用。

  1. 登录PAI控制台

  2. 概览页面选择目标地域。

  3. 在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称。

  4. 工作空间详情页面的左侧导航栏选择模型开发与训练 > 交互式建模(DSW)

  5. 交互式建模(DSW)页面下的开发机实例页签,单击新建实例

  6. 新建实例向导页面,配置以下关键参数。其他参数取默认配置即可。更多详细内容,请参见创建DSW实例

    参数

    描述

    实例名称

    您可以自定义实例名称,本教程示例为test_01

    资源类型

    本教程选择公共资源,使用按量付费模式。

    资源规格

    本教程选择GPU规格,规格名称为ecs.gn7i-c8g1.2xlarge

    镜像

    本文示例,选择官方镜像中的stable-diffusion-webui-develop:1.0-pytorch2.0-gpu-py310-cu117-ubuntu22.04

    存储路径挂载

    单击通用型NAS,配置以下重点参数,其他参数可保持默认值。更多关于数据集的信息,请参见创建及管理数据集

    • 选择文件系统:在下拉框中选择上述步骤中已创建的NAS文件系统。

    • 文件系统挂载点:选择文件系统的挂载点。

    • 文件系统路径/

    • 挂载路径:/mnt/data/

    网络信息

    安全组:在下拉框中选择已创建的安全组。

    可见范围

    选择仅实例所有者可见。

  7. 单击确定

    DSW实例创建需要等待大约10分钟,DSW实例创建成功,且状态为运行中

步骤三:验证挂载

  1. 返回DSW页面,单击刚创建的DSW实例操作列的打开

  2. DSW实例页面的顶部菜单栏中,单击Terminal页签。然后按照操作指引打开Terminal。

  3. Terminal中,输入以下命令,查看NAS数据集是否挂载成功。

    mount | grep nas

    系统输出如下返回结果,说明数据集已成功挂载。

    image.png

    其中,/mnt/data即为创建DSW实例时指定的挂载路径,后续只要您的NAS盘和服务正常运行,数据和代码就可以持久化存储。

相关文档