当您的团队需要在DataWorks中进行协同开发时,面临着项目隔离、权限分配和计算资源管理的挑战。工作空间正是解决这些问题的核心单元,它通过提供一个独立的环境,让您能够清晰地组织开发任务、分配成员角色并绑定所需的计算引擎,从而确保数据开发流程的有序、安全与高效。
工作空间概述
工作空间是DataWorks中进行任务开发和成员权限管理的基本单元,所有开发工作都将在DataWorks自定义的工作空间内完成。一个工作空间支持创建多种数据源,以管理数据源中存储的数据;同时支持绑定多种计算资源,以进行任务开发、调度任务等操作。工作空间管理员将成员添加至工作空间中,并赋予该成员不同的角色,例如:空间管理员、数据分析师、部署、开发、数据治理管理员、模型设计师、访客、运维、项目所有者、安全管理员,以实现多角色协同工作的业务场景。
选择工作空间类型
DataWorks提供两种类型的工作空间模式:简单模式和标准模式。两种模式的开发行为及数据安全不同,建议您在实际开发时,选择标准模式工作空间。详情请参见工作空间模式区别、工作空间模式升级。
工作空间核心操作
核心操作 | 操作说明 | 相关文档 | |
生命周期管理 | 创建工作空间 | 根据不同的业务场景规划和创建工作空间,以实现业务隔离。 DataWorks内置一个默认工作空间,主要用于新用户快速体验,强烈建议不要在其中进行任何生产任务的开发。关于它与您自建工作空间的详细区别,请参见系统内置默认工作空间。 | |
删除工作空间 | 当不再需要某个工作空间及其所有开发成果时,可以选择删除工作空间。删除工作空间通常用于彻底清理资源,避免产生任何潜在计费或数据残留。 | ||
禁用工作空间 | 当暂时不需要使用某个工作空间,但希望保留其代码和配置以备后续使用时,可以选择禁用工作空间。禁用工作空间适用于暂停任务调度,同时保留历史数据以便未来重新启用。 | ||
工作空间信息配置 | 查看工作空间配置,同时可修改部分配置(例如,升级工作空间模式)。 | ||
资源配置 | 绑定计算资源 | 通过绑定计算资源(如MaxCompute、EMR Serverless Spark、Hologres等),实现工作空间中的任务开发、周期调度等操作。 绑定计算资源时,系统将自动创建对应数据源。 | |
添加数据源 | 通过添加数据源(如MaxCompute、E-MapReduce、ClickHouse等),实现与各类数据存储服务的连接,以作为DataWorks上任务执行的数据来源,并为后续的数据同步、分析等提供基础。 重要 在创建数据源之前,请务必提前了解工作空间模式区别(简单模式 VS 标准模式),因为您的数据开发流程和权限控制将基于所选模式的特性进行配置和执行。 | ||
绑定资源组 | DataWorks 资源组是执行任务所需的计算能力单元。将资源组绑定至工作空间,以实现算力管理。 | ||
团队与权限 | 成员角色规划与分配 |
重要 在进行权限分配前,请先了解DataWorks空间级权限体系,然后再进行操作。 |
应用于生产建议
无论采用何种维度规划创建工作空间,建议遵循以下通用准则:
预先规划空间:创建工作空间前,请参考规划工作空间,根据业务线、项目或数据域来设计合理的组织结构,避免后期管理混乱。
工作空间命名:建议使用包含明确业务含义的命名,例如,
finance_tax_report
(财务域-税务报表项目)。存在跨空间引用节点时,建议节点名称包含工作空间名称缩写,便于快速识别。
工作空间模式:标准模式支持开发环境和生产环境的物理隔离,建议您在实际开发时,选择标准模式工作空间。
工作空间权限:工作空间应由主账号创建,并授予子账号(RAM用户)工作空间管理员角色。原则上任何人不应同时具备开发和运维角色。
默认工作空间:默认工作空间不建议用于生产任务开发。