本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。
交互式建模(DSW)是PAI的云端机器学习开发IDE,集成了Notebook、VSCode、Terminal多种开发环境,免去您手动购买、安装和启动云服务器ECS,使用DSW即可快速开始AI模型代码编写、调试和运行。
前提条件
使用主账号开通PAI并创建工作空间。登录PAI控制台,左上角选择开通区域,然后一键授权和开通产品,详情见开通PAI并创建工作空间。
操作账号授权。当使用主账号操作时,可跳过此步。当使用RAM账号时,需要具有算法开发和算法运维角色,或空间管理员角色。操作账号授权请参见管理工作空间 > 成员角色配置。
通过控制台创建实例
初次使用DSW的用户,推荐您使用控制台的方式创建实例,除此之外,DSW还提供了通过Python SDK创建实例的方式。
当您使用公共资源创建实例后,将开始按照实例的服务时长计费,当停止或删除实例后计费才会停止,详细计费规则,请参见交互式建模(DSW)计费说明。
进入DSW页面。
登录PAI控制台。
在概览页面选择目标地域。
在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。
在工作空间页面的左侧导航栏选择 ,进入DSW页面。
单击新建实例。
在配置实例向导页面,配置以下关键参数。
基础信息
参数
描述
参数
描述
实例名称
参考界面提示信息配置DSW实例名称。
标签
根据业务需要对实例打标,方便您对资源进行多维度查找、定位、批量操作、分账。
资源信息
参数
描述
参数
描述
资源类型
公共资源:按量付费模式,无法转为包年包月。
使用公共资源,每个阿里云账号(主账号)在每个Region有2卡GPU的限制,当资源使用量超出限额时可能会出现报错。如果您需要提升限额,请提交工单联系我们。
资源配额:包年包月计费模式。
资源配额:可选择通用计算资源、灵骏智算资源,如果没有可选资源,单击关联资源配额进行配置。
资源规格:根据实际需求设置GPU、CPU和内存等。
优先级: 优先级范围为1~9 ,数值越大,优先级越高。
CPU亲和性:能够将容器或Pod中的进程绑定到特定的CPU核心上执行。通过这种方式,可以减少CPU缓存未命中、上下文切换等现象,从而提高CPU利用率,提升应用性能,适用于对性能敏感和实时性要求高的场景。
当前仅华北2(北京)、华南1(深圳)地域支持配置该参数。
环境信息
描述
描述
镜像
除了可以选择官方镜像外,还支持以下镜像类型:
系统盘
用于存储开发过程中的文件。当资源类型选择公共资源,或当资源配额选择预付费通用计算资源(CPU核数≥2且内存≥4G,或配置GPU)时:每个实例会赠送100 GiB免费系统盘额度。云盘支持扩容,具体扩容价格以控制台界面为准。
仅使用免费额度系统盘,如果实例停机超过15天,云盘的内容将被清空
扩容后不支持缩容,请按需操作扩容。
扩容后整块系统盘(免费+付费),不再受到停机15天释放的限制,但会持续产生费用。
实例删除,系统盘同步释放,删除前请确保必要数据备份。
如果您需要永久性存储,可以配置数据集挂载或存储路径挂载。
数据集挂载
可用于存储需要读取的数据集,或持久化存储开发过程中的文件,支持以下两种数据集类型:
自定义数据集:您可以创建自定义数据集来存放训练所需的数据文件,支持设置是否只读,支持在版本列表中选择数据集版本。
公共数据集:PAI预置有公开的数据集,只支持只读挂载模式。
挂载路径:表示数据集挂载到DSW的路径,例如
/mnt/data
,在代码中您可以检索该路径获取数据集。多个数据集挂载的路径不能重复。
如果配置了CPFS类型的数据集,则需要设置网络配置,且选择的专有网络需要与CPFS一致。否则,DSW实例可能会创建失败。
当资源组选择专有资源组时,第一个数据集必须选择NAS类型数据集,且会被同时挂载到您指定的路径和DSW默认工作目录/mnt/workspace/下。
更多关于挂载的详情,请参见DSW挂载配置。
存储路径挂载
您也可以使用存储类型挂载存储需要读取的数据集,或持久化存储开发过程中的文件。
支持类型:OSS、通用型NAS、极速型NAS、CPFS、智算CPFS。
挂载路径:表示数据集挂载到DSW的路径,例如
/mnt/data
,在代码中您可以检索该路径获取数据集。
更多关于挂载的详情,请参见DSW挂载配置。
工作目录
工作目录是Notebook、WebIDE的启动路径,挂载至
/mnt/workspace
。网络信息
参数
描述
参数
描述
专有网络配置
仅当资源配额选择公共资源时,支持配置该参数。
当您想要在专有网络内使用DSW实例时,可配置此参数,同时配置交换机和安全组。不同场景的配置策略详情,请参见DSW网络配置。
公网访问网关
支持以下配置方法:
公有网关:其网络带宽受限,在用户高并发或下载大型文件时,网络速度可能无法满足需求。
专有网关:为解决公有网关带宽限制问题,可以在DSW的专有网络中创建公网NAT网关、绑定EIP并配置SNAT条目,详情请参考通过专有网关提升公网访问速率。
仅当挂载配置选择CPFS类型的数据集时,支持配置以下参数:
启用所有选项:默认为关闭,系统会禁用与CPFS类型的数据集不通的专有网络。
如果挂载配置选择了CPFS类型的数据集,则需要配置专有网络,且选择的专有网络需要与CPFS一致。
访问配置
参数
描述
参数
描述
启用SSH
用于远程连接实例,选择专有网络后可配置。若您配置了自定义镜像,请确认自定义镜像安装了sshd。
SSH公钥
打开SSH配置开关后可配置该参数。
如果您需要同时支持VPC内登录和公网登录方式,您需要同时添加多个客户端的公钥。请按照回车换行的方式逐个添加公钥,最多支持添加10个公钥。
SSH访问方式
打开SSH配置开关后可配置该参数。
VPC内访问:默认支持该访问方式。您可以从VPC内的其他终端(例如ECS),通过SSH远程连接DSW实例。
公网访问:选中该项,可以增加公网访问方式。后续,您可以通过本地命令行或其他终端使用SSH远程连接实例。
NAT网关:选择为专有网络创建的公网NAT网关。
弹性公网IP:选择在公网NAT网关中已创建的弹性公网IP。
自定义服务
用于在公网中访问DSW中启动的服务,详情请参见在公网中访问实例中的服务。
创建VPC内访问域名
创建一条内置权威域名(Private Zone),您可在VPC内使用该域名来访问当前实例的SSH服务或其他自定义服务,避免使用变化的实例IP带来的访问不便。请注意创建的内置权威域名会产生费用,详情请参见云解析DNS产品计费。
高级信息
参数
描述
参数
描述
可见范围
可选择仅实例所有者可见或工作空间内公开可见。
实例所有者
仅工作空间管理员可修改实例所有者。
确认所选配置无问题后,单击确定。
相关文档
DSW支持接入多种数据源,包括OSS、NAS和MaxCompute,详情请参见读写OSS、MaxCompute数据。
DSW提供了数据上传和下载功能,适用于小数据量的文件传输,详情请参见上传与下载数据文件。
DSW的功能特点、使用流程、快速入门等,详情请参见DSW概述。
关于DSW的使用案例,详情请参见DSW使用案例汇总。
创建实例后,您可以将当前运行中的DSW实例环境保存为自定义镜像以便后续使用。详情请参见制作DSW实例镜像。
附录: 通过Python SDK创建实例
安装阿里云的Credentials工具。当您通过阿里云SDK调用OpenAPI进行资源操作时,必须安装Credentials工具配置凭证信息。要求:
Python版本 >= 3.7。
使用V2.0代系的阿里云SDK。
pip install alibabacloud_credentials
获取账号AccessKey。本示例使用AK信息配置访问凭证,为防止账号信息泄露,建议您将AccessKey配置为环境变量,id和secret环境变量名分别为ALIBABA_CLOUD_ACCESS_KEY_ID、ALIBABA_CLOUD_ACCESS_KEY_SECRET。
获取AccessKey信息,请参见创建AccessKey。
如何设置环境变量,请参见配置环境变量。
其它Credentials凭证配置方式,请参见安装Credentials工具。
安装PAI相关Python SDK。
# 工作空间SDK安装。 pip install alibabacloud-aiworkspace20210204 -U -q # DSW SDK安装。 pip install alibabacloud_pai_dsw20220101 -U -q # OpenAPI依赖。 pip install alibabacloud_tea_openapi -U -q # 预付费资源组查询SDK安装。 pip install https://sdk-portal-us-prod.oss-accelerate.aliyuncs.com/downloads/u-b8602de7-c468-436c-8a02-2eca4a30d376-python-paistudio.zip -U -q
创建一个DSW实例。
关于更多接口的说明,请参见API概览。
- 本页导读 (1)
- 前提条件
- 通过控制台创建实例
- 基础信息
- 资源信息
- 环境信息
- 网络信息
- 访问配置
- 高级信息
- 相关文档
- 附录: 通过Python SDK创建实例