当您需要为新的数据项目启动开发工作时,面临着如何隔离代码、资源和团队成员,以避免项目混乱和安全风险的挑战。DataWorks 工作空间正是为此设计的解决方案。它通过提供一个独立的、项目制的容器,让您能够结构化地管理开发任务、计算资源和成员权限,从而实现安全、有序、高效的团队协同开发。
推荐您优先阅读工作空间概述。
核心示例
对于有经验的用户,您可以通过以下最简路径创建一个可用于生产的标准工作空间:
进入DataWorks工作空间列表,确认顶部地域选择无误(地域创建后不可更改!),单击创建工作空间。
在创建页面,完成以下关键配置:
工作空间名称:输入一个唯一的、符合您团队规范的名称。
生产、开发环境隔离:开启。这将创建一个标准模式的工作空间,确保开发与生产环境隔离。
使用新版数据开发(Data Studio):开启。推荐使用新版数据开发。
若不可见该选项,代表默认开启。
单击创建工作空间。
创建成功后,下一步请参考绑定计算资源。
权限说明
执行创建操作的账号必须满足以下条件之一:
为阿里云主账号。
为已授予
AliyunDataWorksFullAccess
或CreateWorkspace
权限策略的 RAM 用户。详情参见为RAM用户授权。
创建前规划
创建工作空间前,您需先规划工作空间并选择合适的空间模式。
操作项 | 描述 | 参考链接 |
规划工作空间 | 工作空间为DataWorks支持的最大业务划分粒度。使用工作空间前,根据需求制定适用于不同场景的工作空间划分方案。 | |
选择空间模式 | DataWorks工作空间分为简单模式与标准模式。
强烈建议所有生产项目选择标准模式。 |
创建工作空间
步骤一:切换地域并确认时区
工作空间是基于地域创建的,您需根据业务数据的使用地域,先切换至所需地域,在相应地域下创建工作空间。
在控制台顶部菜单栏切换所需地域。
重要在选择地域前,请务必确认以下信息,因为地域一旦选定,创建工作空间后将无法更改地域。
地域与时区的关系:
默认调度时区:工作空间的调度时区默认与您所选的地域时区保持一致。例如,华北2(北京)默认调度时区为UTC+8。若默认时区不符合预期,请参见下一行说明:多时区支持。
多时区支持:部分地域支持手动切换到其他调度时区。阅读切换调度时区,确认您选择的地域是否支持以及支持哪些时区。
夏令时影响:若您选择的地域会实施夏令时(如德国法兰克福、美国弗吉尼亚等),为避免时区切换对周期调度任务产生非预期影响,强烈建议您提前阅读场景:夏令时切换对调度任务运行的影响。
步骤二:创建工作空间
关于默认工作空间:系统内置一个名为 default_workspace_xxxx
的默认工作空间。它仅用于快速体验,严禁用于生产。它是一个权限开放、无环境隔离的简单模式空间。详情参见系统内置默认工作空间。
在工作空间列表页,单击创建工作空间,进入创建页面。
在创建页面,按照下表说明配置参数。
参数
描述
基本信息
工作空间名称
当前工作空间的唯一标识,创建后无法修改。
显示名
建议基于业务属性命名,便于标识工作空间用途。
核心模式与功能
生产、开发环境隔离
定义工作空间模式,即工作空间的生产环境和开发环境是否隔离。
开启:需隔离生产、开发环境,该方式创建的工作空间为标准模式工作空间。
关闭:无需隔离生产、开发环境,该方式创建的工作空间为简单模式工作空间。
建议在生产环境下,开启该选项。
使用新版数据开发(Data Studio)
建议开启该选项,可体验数据开发(Data Studio)(新版)最新特性。不开启,则使用数据开发(DataStudio)(旧版)。
重要若您在界面上未看到此选项,代表您的工作空间已默认启用新版数据开发。
工作空间模板
工作空间模板定义DataWorks工作空间中可用的工具、资源和功能。
选择工作空间模板后,您可以根据实际需求添加相应类型的计算资源和数据源。更多详情请参见工作空间模板介绍。
高级配置
空间管理员
定义该工作空间的管理员,默认当前登录账号为该工作空间的管理员。可添加其他RAM子账号为管理员,协同管理该工作空间。工作空间管理员权限较大,请谨慎授权,详情请参考空间管理员职责。
创建同名AI工作空间
是否创建相同名称的AI工作空间,默认开启,您可以在AI工作空间中调度PAI上的算法任务。
DataWork工作空间默认资源组
工作空间中任务运行时默认使用的DataWorks资源组,后续可在工作空间配置中修改。
阿里云资源组
选择阿里云资源管理中创建的资源组,默认选择默认资源组。
若已购买多种阿里云资源,则可通过资源管理创建资源组进行云资源分组,并为资源组设置管理员,通过分组独立管理资源组内的所有资源。
重要此处选择的资源组是在阿里云账号下进行资源分组管理的一种机制,帮助您解决单个阿里云账号内的资源分组和授权管理的复杂性问题。与DataWorks产品所说的任务运行需使用的资源组为两个概念,请注意区分。
步骤三:绑定计算资源
创建工作空间后,为其绑定计算资源(如 MaxCompute),以进行相关大数据开发任务。
应用于生产建议
模式选择:建议使用标准模式,以实现开发环境和生产环境隔离。
命名规范:建立统一规范,使用包含明确业务含义的命名,例如,
finance_tax_report
(财务域-税务报表项目)。时区确认:对于有跨国业务的团队,务必在创建前确认调度时区策略。
后续步骤
完成工作空间创建之后,需要为工作空间添加空间成员。
查看修改工作空间配置或删除、禁用工作空间,请参见管理工作空间。
附录
工作空间模板介绍
工作空间名称 | 适用场景 | 特征 | 支持地域 |
DataWorks工作空间 | 适用于更广泛的业务场景,可按需配置所需的计算资源和数据源。 | 基于DataWorks版本功能,支持完全自由配置的工作空间模式。 | 全部DataWorks部署地域。 |
OpenLake工作空间 | 适用于开放可控数据湖仓构建的大数据/搜索/AI一体化解决方案的工作空间。 |
| 仅华东1(杭州)、华东2(上海)、华北2(北京)、华南1(深圳)地域支持创建OpenLake工作空间。 |
系统内置默认工作空间
当您首次使用DataWorks或开通新地域的DataWorks服务时,DataWorks将默认进行以下操作,以免除前期准备工作,快速进入开发状态。
自动生成默认工作空间(名称以default_workspace_开头)。
自动生成默认按量付费资源组(名称为dataworks_default_resource_group)。
默认创建MaxCompute项目并绑定为计算资源(名称以default_datasource_开头)。
在新购资源组的时候会自动与默认工作空间绑定。
默认工作空间不建议用于生产任务的开发。
默认工作空间 VS 自建工作空间基本属性
以下为DataWorks空间的默认空间属性和自行定义工作空间属性对比。
空间属性 | 系统默认工作空间 | 用户自建工作空间 |
空间名称 | default_workspace_4位随机码,不可变更。 | 自定义,创建后不可变更。 |
空间显示名称 | 默认工作空间,可修改空间显示名称。 | 自定义,创建后可修改。 |
空间模式 | 简单模式工作空间。开启新版数据开发的工作空间不支持升级为标准模式工作空间,未开启则支持升级。 | 可选择创建简单模式或者标准模式工作空间。 |
空间管理员 | 根据实际开通DataWorks的人员身份分为以下场景:
| 与系统默认工作空间一致。 |
空间调度时区 | 调度时区默认为本地时区,如需调整,请参考切换调度时区文档进行调整。 | 与系统默认工作空间一致。 |
默认工作空间 VS 自建工作空间可见范围
特性 | 系统默认工作空间 | 用户自建工作空间 |
核心逻辑 | 开放制 / 默认访问模式 | 邀请制 / 白名单模式 |
可见性 | 全局可见:对当前租户下的所有成员均可见。 | 受限可见:仅对被明确加入的租户成员可见。 |
访问方式 | 租户内任何成员均可主动单击进入。 | 成员必须由空间管理员手动添加后才能访问。 |
角色逻辑 | 自动授予:成员首次单击进入时,系统自动授予访客角色。 | 显式指定:成员加入时,其角色由空间管理员明确指定。 |