文档

DataWorks准备工作流程

更新时间:

DataWorks是为您提供专业高效、安全可靠的一站式大数据开发与治理平台,使用其进行数据开发前,您需做好相关准备工作,保障后续开发任务可顺利执行。本文为您介绍DataWorks的购买及环境准备流程,帮助您快速开通DataWorks并准备所需开发环境。

背景信息

  • 新用户须知

    如果您是首次使用DataWorks的用户,建议先阅读以下内容。

    • 产品简介:为您介绍什么是DataWorks、DataWorks的购买建议、以及DataWorks基本架构和发展之路。

    • 产品计费:为您介绍DataWorks的计费方式。

    • 购买指引:为您推荐不同需求背景下的DataWorks购买方案。

  • 账号说明

    DataWorks的账号登录体系与阿里云保持一致,统一采用阿里云账号或RAM用户登录。

    • 阿里云账号:即主账号,是阿里云资源的归属及使用计量计费的基本主体,负责生成本企业组织下的子账号,并对子账号进行管理、授权等。

    • RAM用户:即子账号,由主账号在RAM系统(即阿里云的访问控制)中创建并进行管理,其本身不拥有资源,也没有独立的计量计费,子账号由所属主账号统一控制和付费。

环境准备

DataWorks环境准备主流程如下。准备工作若您仅需使用阿里云账号(主账号)进行体验,请参考下文主账号体验环境准备进行操作;若您需使用RAM用户(子账号)进行协同开发,则可参考下文正式开发环境准备进行操作。

主账号体验环境准备

  1. 准备阿里云账号(主账号):使用阿里云产品服务前,您需先创建阿里云账号。

  2. 开通DataWorks服务:使用DataWorks前,您需先开通DataWorks相关服务。DataWorks提供了服务场景化的一键开通,以及产品的单独开通,您可根据需要选择任意方式开通所需服务。

  3. 创建DataWorks工作空间:工作空间是DataWorks管理任务、成员,分配角色和权限的基本单元,所有的开发工作都将在工作空间内完成,因此在进行开发操作前,您需先创建工作空间。

  4. 在工作空间创建数据源或注册集群:使用DataWorks进行数据开发前,您需先开通所需计算引擎,并在DataWorks工作空间中将该引擎项目创建为工作空间的数据源或注册为工作空间的集群。若需要基于该数据源进行调度任务的开发与周期性执行,还需将数据源绑定至数据开发(DataStudio)。

正式开发环境准备

准备流程与主账号体验环境大体一致,在体验流程基础上,需主账号创建RAM用户(子账号),并将RAM用户(子账号)加入工作空间进行后续的开发操作。具体如下:

  1. 准备用于DataWorks开发的RAM用户:在开通的阿里云账号下新建多个RAM用户(子账号),并授权各用户不同的使用权限,后续可基于不同开发场景选择相应RAM用户(子账号)进行数据开发。

  2. 为工作空间添加空间成员:工作空间创建完成后,将RAM用户(子账号)添加至对应工作空间中以便进行协同开发。添加空间成员时,支持以工作空间为管控粒度,通过授予用户不同角色,实现对工作空间内各功能点的权限控制。

后续步骤

环境准备完成后,您可进入模块入门或产品教程进行DataWorks任务开发的实操体验。详情请参见通过DataStudio创建第一个周期调度任务教程概述