使用流程

本文为您介绍DSW完整的使用流程。

步骤一:准备工作

  1. 权限开通

    1. 使用主账号开通PAI并创建工作空间。建议您开通服务时点击服务角色授权,避免在使用子产品时多次授权,详情见开通PAI并创建工作空间

    2. 操作账号授权。操作账号,即用户操作时使用的云账号。当使用主账号操作DSW时,可跳过此步。当使用RAM账号操作时,需要进行操作账号授权

    3. PAI服务账号授权。PAI服务账号,用于PAI服务访问其它PAI子产品或其它云产品。如果在步骤a中已点击服务角色授权,可跳过此步。否则,请分别进行DSW服务账号授权DLC服务账号授权

  2. 【可选】准备专有资源组

    在完成步骤1后,系统将为您准备好公共资源组。当您需要使用专有资源组时,请参见新建及管理通用计算资源新建资源组并购买灵骏智算资源

  3. 【可选】挂载数据集

    公共资源组和专有资源组默认数据存储空间有限,且无法持久化存储,因此,当您需要扩展实例的存储空间或持久化存储数据时,可通过挂载NAS、OSS类型数据集或OSS路径的方式实现。新建数据集,请参见创建及管理数据集

    重要
    • 公共资源组的DSW实例,数据存储在空间有限的免费云盘中,在删除实例或停机超过15天后,云盘数据将被清空。

    • 专有资源组的DSW实例,数据存储在实例的系统盘中,在停止或删除实例后,临时存储将被清空。

  4. 【可选】自定义镜像

    DSW预置了多种类型的官方镜像,例如PyTorch、TensorFlow、ModelScope等。如果您需要自定义镜像来满足特定场景下的开发需求,请参见自定义镜像

步骤二:创建及访问DSW实例

  1. 创建实例

    DSW实例创建,请参见创建DSW实例

  2. 管理实例

    • 实例生命周期管理及配置变更。启动、停止和删除实例,及实例规格、镜像和数据集等配置变更操作,请参见管理DSW实例

    • 实例成本优化。为节省成本,建议您配置闲置关机和定时关机策略,对于免费试用实例,实例自动开启闲置关机。通用场景下,用户管理员可以在工作空间调度中心配置资源回收策略,请参见工作空间调度中心注意:专有资源组临时存储的数据在实例停止后将被清空,请及时导出。

  3. 访问实例

    • 通过控制台访问实例。推荐您通过控制台打开DSW实例,操作简单,无需处理复杂的网络和权限配置,同时能够利用DSW丰富的功能特性,使用方法请参见访问DSW实例

    • 使用SSH访问实例。如果您想要通过SSH远程连接DSW实例,例如:使用云上DSW实例运行本地Notebook代码的场景,请参见连接DSW实例

步骤三:使用DSW实例

  1. 模型开发与训练

    您可以直接在DSW实例中进行模型开发,DSW提供了交互式的开发环境,便于调试代码和查看运行结果。您可以管理第三方库,以满足特定的环境需求。

    分布式训练的具体操作,请参见创建训练任务

  2. 模型部署

    训练好的模型,您可以将其部署为EAS在线服务,以实现模型推理功能。具体操作,请参见模型部署

  3. 数据传输

    • 数据源接入。除了挂载数据集之外,DSW还支持接入多种数据源,包括OSSMaxCompute。您可以将数据文件从不同的数据源导入到DSW实例中,并将处理后的数据导出到指定的数据源,请参见读写数据

    • 上传与下载。DSW实例还提供了数据上传和下载功能,以及Notebook的导出和分享功能,请参见文件传输与处理

步骤四:玩转DSW实例

  1. 最佳实践

    DSW Gallery提供了丰富的Notebook案例,包括LLM、AIGC前沿领域,覆盖了Llama2、通义千问、Stable Diffusion等热门模型,您可以选择感兴趣的内容,在DSW一键运行,以及二次开发。请参见Notebook Gallery

  2. 高阶功能

    除了上述功能之外,DSW还支持以下高阶应用场景:

更多操作实践,请参见DSW使用案例汇总