本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。
DSW(Data Science Workshop)为您提供云端IDE的AI开发环境(开发机),熟悉Notebook/VSCode的开发者,可以快速开始模型开发。本文为您介绍如何创建DSW实例,以及实例启动和释放时常见的问题。
快速创建一个基础DSW实例
登录PAI控制台,选择目标地域,在左侧导航栏单击工作空间列表,选择并进入目标工作空间。
在左侧导航栏单击交互式建模(DSW) > 新建实例,配置以下关键参数,其他参数默认即可。控制台全量参数请参见控制台全参数列表。
参数
说明
实例名称
例如:
dsw_test。资源类型
选择公共资源,其采用按量付费的计费方式。
资源规格
选择如:
ecs.gn7i-c8g1.2xlarge(配置为:1张A10 GPU、8 vCPU、30 GiB内存)。如果该规格库存不足,请尝试选择列表中的其他规格。
镜像配置
选择官方镜像,搜索并选择
modelscope:1.31.0-pytorch2.8.0-gpu-py311-cu124-ubuntu22.04(Python版本为3.11、CUDA版本为12.4)。ModelScope的镜像兼容性较好,且三方库较全,因此推荐使用ModelScope镜像。
单击确定创建实例,当实例状态为运行中时,代表创建成功。
如果实例启动失败请参见DSW实例启动常见问题。
在DSW实例列表页,单击右侧操作列下的打开按钮,即可进入DSW实例开始模型开发。
后续您可以查看控制台访问和管理DSW,了解DSW实例界面的功能,以及如何停止、释放、变更DSW实例。
使用公共资源创建DSW实例后,将开始按照实例的服务时长计费。当不需要使用DSW时请及时停止或删除实例,以免继续扣费。
上述创建的DSW示例,数据默认存储在免费的云盘中,如果实例停止超过15天,云盘的内容将被清空,且无法恢复。对于重要数据请及时备份,或挂载并转移至云存储中。
典型应用场景配置
基础的DSW实例配置在实际AI开发中可能无法满足需要,因此,以下为您总结了典型的应用场景配置:
场景 | 需求/痛点 | 配置要点 | 相关文档 |
持久化存储代码和数据 | DSW实例的系统盘是临时存储,在实例删除或长时间停止后数据会被清空。 需要长期保存重要文件,或在多个实例间共享数据。 | 通过数据集挂载或存储路径挂载将云存储(如:对象存储OSS)挂载到实例指定目录下。 | |
提升公网下载速度 | DSW实例默认使用共享网关,受带宽限制,下载大型文件时网速可能无法满足需求。 | 在网络信息中,配置专有网络(VPC),并使用专有网关。还需要为VPC创建NAT网关和弹性公网IP (EIP)。 | |
通过SSH远程开发 | 习惯使用本地的VSCode、PyCharm等工具进行开发和调试,不希望局限于Web IDE。 | 在访问配置中,启用SSH,填入SSH公钥,并选择公网访问方式,关联已有的NAT网关和弹性公网IP (EIP)。 | |
访问实例内的Web服务 | 将实例内运行的Web应用发布到公网,以便通过URL直接访问或分享。 | 在访问配置中,添加自定义服务,配置服务端口并启用公网访问。同时,必须在安全组中添加入方向规则,放行该端口。 |
控制台全参数列表
基础信息
参数 | 描述 |
实例名称 | 参考界面提示信息配置实例名称。 |
标签 | 根据业务需要对实例打标,便于对资源进行多维度查找、定位、批量操作、分账。 |
资源信息
参数 | 描述 |
资源类型 |
|
环境信息
参数 | 描述 |
镜像配置 | 除了可以选择官方镜像外,还支持以下镜像类型: |
系统盘 | 用于存储开发过程中的文件。当资源类型选择公共资源,或当资源配额选择预付费通用计算资源(CPU核数≥2且内存≥4G,或配有GPU)时:每个实例会赠送100 GiB免费云盘作为系统盘。云盘支持扩容,具体扩容价格以控制台界面为准。 警告
如果您需要永久性存储,可以配置数据集挂载或存储路径挂载。 |
数据集挂载 | 可用于存储需要读取的数据集,或持久化存储开发过程中的文件,支持以下两种数据集类型:
挂载路径:表示数据集挂载到DSW的路径,例如 说明
更多关于挂载的详情,请参见挂载数据集/OSS/NAS/CPFS。 |
存储挂载 | 您也可以使用存储类型挂载存储需要读取的数据集,或持久化存储开发过程中的文件。 更多关于挂载的详情,请参见挂载数据集/OSS/NAS/CPFS。 |
工作目录 | 工作目录是Notebook、WebIDE的启动路径,默认为 |
网络信息
参数 | 描述 |
专有网络配置 | 仅当资源类型选择公共资源时,支持配置该参数。 当您想要在专有网络VPC内使用DSW实例时,可以在DSW相同地域创建VPC并配置此参数,同时需配置交换机和安全组。不同场景的配置策略详情,请参见网络配置。 |
公网访问网关 | 支持以下配置方法:
仅当挂载配置选择CPFS类型的数据集时,支持配置以下参数:
说明 如果挂载配置选择了CPFS类型的数据集,则需要配置专有网络,且选择的专有网络需要与CPFS一致。 |
访问配置
参数 | 描述 |
启用SSH | 用于远程连接实例,选择专有网络后可配置。当打开该开关后,会出现名称为SSH的自定义服务。若您配置了自定义镜像,请确认自定义镜像安装了sshd。 |
SSH公钥 | 打开SSH配置开关后可配置该参数。 说明 如果需要同时支持VPC内登录和公网登录方式,您需要同时添加多个客户端的公钥。请按照回车换行的方式逐个添加公钥,最多支持添加10个公钥。 |
自定义服务 | 用于配置SSH远程访问或通过公网访问实例中的服务。
|
创建VPC内访问域名 | 创建一条内置权威域名(Private Zone),您可在VPC内使用该域名来访问当前实例的SSH服务或其他自定义服务,避免使用变化的实例IP带来的访问不便。请注意创建的内置权威域名会产生费用,详情请参见云解析DNS产品计费。 |
NAT网关 | 通过公网访问实例中服务时,负责将公网请求 ( |
弹性公网IP | 通过公网访问实例中服务时,提供公网访问IP地址。 |
角色与权限
参数 | 描述 |
可见范围 | 可选择仅实例所有者可见或工作空间内公开可见。 |
实例所有者 | 仅工作空间管理员可修改实例所有者。 |
常见问题
DSW实例启动常见问题
DSW实例停止或释放常见问题
附录: 通过Python SDK创建实例
阿里云 SDK 通过 Credentials 工具获取凭证信息。调用 API 前,请先安装并配置该工具。要求:
Python版本 >= 3.7。
使用V2.0代系的阿里云SDK。
安装命令如下:
pip install alibabacloud_credentials获取账号AccessKey。本示例使用AK信息配置访问凭证,为防止账号信息泄露,建议您将AccessKey配置为环境变量,id和secret环境变量名分别为
ALIBABA_CLOUD_ACCESS_KEY_ID、ALIBABA_CLOUD_ACCESS_KEY_SECRET。获取AccessKey信息,请参见创建AccessKey。
如何设置环境变量,请参见配置环境变量。
其它Credentials凭证配置方式,请参见安装Credentials工具。
安装PAI相关Python SDK。
# 工作空间SDK安装。 pip install alibabacloud-aiworkspace20210204 -U -q # DSW SDK安装。 pip install alibabacloud_pai_dsw20220101 -U -q # OpenAPI依赖。 pip install alibabacloud_tea_openapi -U -q # 预付费资源组查询SDK安装。 pip install https://sdk-portal-us-prod.oss-accelerate.aliyuncs.com/downloads/u-b8602de7-c468-436c-8a02-2eca4a30d376-python-paistudio.zip -U -q创建一个DSW实例。
关于更多接口的说明,请参见API概览。











