DataWorks是为您提供专业高效、安全可靠的一站式大数据开发与治理平台,使用其进行数据开发前,您需做好相关准备工作,保障后续开发任务可顺利执行。本文为您介绍DataWorks的购买及环境准备流程,帮助您快速开通DataWorks并准备所需开发环境。
背景信息
新用户须知
账号说明
DataWorks的账号登录体系与阿里云保持一致,统一采用阿里云账号或RAM用户登录。
阿里云账号:即主账号,是阿里云资源的归属及使用计量计费的基本主体,负责生成本企业组织下的子账号,并对子账号进行管理、授权等。
RAM用户:即子账号,由主账号在RAM系统(即阿里云的访问控制)中创建并进行管理,其本身不拥有资源,也没有独立的计量计费,子账号由所属主账号统一控制和付费。
环境准备
DataWorks环境准备主流程如下。若您仅需使用阿里云账号(主账号)进行体验,请参考下文主账号体验环境准备进行操作;若您需使用RAM用户(子账号)进行协同开发,则可参考下文正式开发环境准备进行操作。
主账号体验环境准备
准备阿里云账号(主账号):使用阿里云产品服务前,您需先创建阿里云账号。
开通DataWorks服务:使用DataWorks前,您需先开通DataWorks相关服务。DataWorks提供了服务场景化的一键开通,以及产品的单独开通,您可根据需要选择任意方式开通所需服务。
创建DataWorks工作空间:工作空间是DataWorks管理任务、成员,分配角色和权限的基本单元,所有的开发工作都将在工作空间内完成,因此在进行开发操作前,您需先创建工作空间。
在工作空间创建数据源或注册集群:使用DataWorks进行数据开发前,您需先开通所需计算引擎,并在DataWorks工作空间中将该引擎项目创建为工作空间的数据源或注册为工作空间的集群。若需要基于该数据源进行数据开发或配置调度任务,您还需要将其绑定至数据开发(DataStudio)。
首次开通DataWorks开通后会自动创建简单模式的默认工作空间,并自动在DataWorks中创建MaxCompute数据源,同时将该MaxCompute数据源绑定至数据开发(DataStudio),如需创建标准空间,请手动创建空间以及创建数据源与注册集群,详情可参见创建工作空间。
正式开发环境准备
准备流程与主账号体验环境大体一致,在体验流程基础上,需主账号创建RAM用户(子账号),并将RAM用户(子账号)加入工作空间进行后续的开发操作。具体如下:
准备用于DataWorks开发的RAM用户:在开通的阿里云账号下新建多个RAM用户(子账号),并授权各用户不同的使用权限,后续可基于不同开发场景选择相应RAM用户(子账号)进行数据开发。
为工作空间添加空间成员:工作空间创建完成后,将RAM用户(子账号)添加至对应工作空间中以便进行协同开发。添加空间成员时,支持以工作空间为管控粒度,通过授予用户不同角色,实现对工作空间内各功能点的权限控制。
后续步骤
环境准备完成后,您可进入模块入门或产品教程进行DataWorks任务开发的实操体验。
若您想要快速体验DataWorks的特性与能力,可参考:DataWorks快速入门。
若您想要通过案例实操带入来体验产品,可参考:综合示例:用户画像分析。
若您想要以创建周期调度任务为目标,可参考:通过DataStudio创建第一个周期调度任务。
若您想要使用内置数据集成能力进行数据同步,可参考:数据集成概述。
若您想要使用内置数据建模能力进行数据建模,可参考:数据建模。