DataWorks工作空间类型分为“简单模式”、“标准模式”两种,两种类型在权限管理上有细分区别。本实践将基于DataWorks标准模式空间完成从“数据建模”到“数据生产”的基本流程,帮助您快速掌握规范化的数据体系建设流程,提升在数据开发过程中的规范性、安全性、稳定性。
背景信息
细分特点 | 简单模式 | 标准模式 |
---|---|---|
描述 | 在简单模式工作空间下,一个DataWorks空间下层对应一个MaxCompute项目(或一个EMR集群、Hologres数据库等),该环境即视为生产(PROD)环境。![]() |
在标准模式工作空间下,一个DataWorks空间下层对应两个MaxCompute项目(或两个EMR集群、Hologres数据库等),一个视为开发(DEV)环境,一个视为生产(PROD)环境。![]() |
权限概述 | 在简单模式空间下,DataWorks的“开发”角色因为与所绑定MaxCompute项目的“Role_Project_Dev” Role进行了映射,因此DataWorks开发角色天然能够读取MaxCompute项目内的所有数据。 | 在标准模式空间下,DataWorks的“开发”角色因为与所绑定MaxCompute项目(dev环境)的“Role_Project_Dev” Role进行了映射,因此:
|
优点 | 简单、方便、易用。
仅需要授权数据开发人员“DataWorks开发角色”即可完成所有数据仓库开发工作。 |
安全、规范。
|
缺点 | 存在不稳定、不安全的风险。
|
流程相对复杂,一般情况下无法一人完成所有数据开发、生产流程。 |
标准模式对使用流程的影响

实践操作流程
Step1:开通产品与创建空间
Step2:角色管理
Step3:权限管理
在上述“角色管理”中已对角色相关内容进行了介绍,虽然部分默认配置涉及数据权限管理(如背景信息),但DataWorks仍提供了更为专业的概述,帮助您快速构建平台的数据内容、个人隐私等相关的安全能力,实现更加精细化、场景化的数据权限及高危风险行为管控,满足企业面向高风险场景的各类安全要求(例如,审计),无需您额外配置即可直接使用该功能。
Step4:数据建模
数据建模的流程包括:创建数据标准、创建数据模型、修改数据模型、保存模型至模型库、提交模型至开发环境计算引擎。操作详情请参见概述。
Step5:数据开发与生产
- 生产开发数据源
DataWorks支持基于标准模式工作空间对应的两个环境这一特性,来分别为这两个环境配置不同的数据库访问地址。即您可以在数据源配置界面分别为开发环境(DataStudio)测试运行时和生产调度时指定不同的数据库访问地址。
同一个名称的数据源存在开发环境和生产环境两套配置,您可以通过数据源隔离使其在不同环境隔离使用。DataWorks将通过判断任务执行环境来自动访问对应环境下该同名数据源对应的配置信息。详情请参考数据源开发和生产环境隔离。 - 调度参数
调度参数是DataWorks在调度场景下支持自动根据业务时间替换为具体值的参数,节点中使用调度参数后,在调度场景下,可以实现将对应业务时间的业务数据动态写入对应的时间分区中。详情请参见调度参数概述。
- 依赖关系
调度依赖就是调度场景下节点间的上下游依赖关系,在DataWorks调度场景中,上游节点运行成功,下游任务节点才会开始运行。
根据表血缘来配置节点调度依赖后,可以保障调度任务在运行时能取到正确的数据,避免下游节点取数据时,上游表数据还未正常产出,导致下游节点取数出现问题。
在DataWorks依赖配置中,上游节点的输出作为下游节点的输入,形成节点依赖关系。平台支持通过自动解析快速设置节点依赖,关于调度依赖详情可参考文档同周期调度依赖逻辑说明。