您可以在计算引擎信息界面将E-MapReduce计算引擎绑定至DataWorks作为DataWorks工作空间的引擎实例。以便可通过DataWorks来执行该引擎类型的计算任务。本文为您介绍如何绑定E-MapReduce引擎。
前提条件
- 已拥有DataWorks空间管理员权限,详情请参见添加及管理工作空间成员。
您还需要授予目标账号
AliyunEMRFullAccess
权限策略,以便目标账号有权限将EMR集群绑定至DataWorks,作为开发EMR任务的引擎环境。授权操作,详情请参见用户、角色与权限概述。 - 您需要将DataWorks上进行数据开发的用户加入目标工作空间,并配置工作空间成员与集群账号映射,以便可在DataWorks上进行EMR集群账号认证及数据权限控制,后续可使用EMR集群身份在DataWorks上执行任务,并让每个空间成员拥有自己的权限,做到数据权限隔离。添加空间成员,详情请参见为工作空间添加空间成员;配置工作空间成员与集群账号映射,详情请参见配置访问身份的映射关系。
- 运行EMR作业前,您需要购买一个独享调度资源组,并与当前EMR集群所在的VPC网络连通。购买并配置独享调度资源组,详情请参见新增和使用独享调度资源组。
独享调度资源组进行初始化,在DataWorks独享调度资源组部署EMR集群的客户端工具并配置,以便顺利执行各类型EMR任务(例如,Hive、Spark、Presto等类型EMR任务)。详情请参见下文引擎绑定的《配置资源初始化》。
背景信息
(必读)请您在操作引擎绑定前务必了解以下内容,这将决定您后续是否可以顺利开展数据开发工作。- 引擎绑定注意事项(重点)。
- 必读:简单模式和标准模式的区别。
- DataWorks为您提供快捷模式和安全模式两种绑定EMR引擎的模式,您可以基于快捷模式快速开展各类数据的工作,并可以基于安全模式实现更具安全性的数据权限管理。详情请参见配置访问方式。
- 快捷模式统一使用Hadoop账号执行任务。
- 安全模式支持指定在DataWorks上执行任务所使用的账号。若您的集群开启LDAP认证或需要对不同的账号进行数据权限安全隔离,则可在DataWorks配置集群账号的映射,详情请参见配置访问身份的映射关系。
关于快捷模式与安全模式的差异,详情请参见快捷模式与安全模式差异比对。
使用限制
- 仅支持使用独享调度资源组在DataWorks运行EMR任务。
- 您需要拥有
AliyunEMRDevelopAccess
权限策略才可绑定引擎。授权详情请参见为RAM用户授权。
进入引擎绑定页面
您可以通过以下两种方式进入引擎绑定页面:
- 方式一:在管理控制台,您可以单击工作空间后操作列的
图标,选择 页面,进入工作空间配置页面,找到计算引擎详情区域,详情请参见工作空间列表。
- 方式二:工作空间创建完成后,您可以进入数据开发、数据集成等模块,在顶部菜单栏右侧单击
图标,进入工作空间配置页面,找到计算引擎详情区域。详情请参见进入工作空间配置页面。
绑定E-MapReduce引擎
- 在计算引擎信息区域,单击E-MapReduce。
- 在E-MapReduce页签下,单击增加实例。
- 在新增EMR集群对话框中,配置各项参数。下图以生产环境为例,开发环境界面类似。说明 DataWorks简单模式和标准模式工作空间的配置不同。DataWorks标准模式的工作空间需要分别配置生产环境和开发环境的参数。
- 单击确定。创建完成后,您可以在绑定的引擎实例界面右上角单击设置为默认实例,将指定引擎设置为数据开发过程中默认选择的引擎。
配置访问身份的映射关系
成功绑定安全模式的EMR后,后续实际执行EMR任务时,使用的是EMR集群配置的访问身份对应的映射账号。配置访问身份的映射关系步骤如下:- 进入EMR集群配置页面。您可以通过如下两种方式进入。
方式 步骤 1 成功添加E-MapReduce引擎后,在弹出的请注意对话框,单击去配置开发环境及去配置生产环境。 2 在计算引擎信息区域的引擎实例绑定页面,单击配置账号映射关系。 - 在编辑EMR集群配置对话框,配置引擎权限映射。
您可以使用如下两种方式配置引擎权限映射关系。
方式 步骤 引用已创建的映射关系 在引用映射关系中直接选择引用当前工作空间中已创建的权限映射关系。 创建新的权限映射关系 选择映射类型后,在配置引擎权限映射区域,选择需要配置映射关系的云账号及相应的映射账号。 说明- 阿里云主账号或拥有AliyunEMRFullAccess权限策略的RAM用户可以为本工作空间所有成员配置身份映射,其余工作空间成员仅可以为自己配置身份映射。
- 您可以添加多个云账号与系统账号、LDAP账号的映射关系。DataWorks支持多个云账号映射至同一个映射账号。
- 在编辑EMR集群配置对话框,配置引擎权限映射。
- 单击确定,完成创建。