EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据仓库,并为生产任务的稳定运行提供保障。本文以HIVECLI任务类型为例,为您介绍如何快速使用EMR Workflow。
前提条件
- 已完成系统角色授权,详情请参见EMR Workflow角色授权。 
- 已在EMR on ECS页面创建集群或集群模板,详情请参见创建集群或创建集群模板。 - 支持绑定的集群类型为DataLake、Hadoop和Custom。 
步骤一:绑定集群和关联工作空间
- 使用阿里云账号(主账号)或RAM用户登录E-MapReduce控制台。 
- 在左侧导航栏,选择EMR Workbench > Workflow。 
- 在Workflow页面,单击调度资源组。 
- 绑定集群或集群模板。 - 在调度资源组页面,单击目标资源组操作列的绑定集群。  
- 在绑定 EMR 集群 / 集群模板对话框中,单击目标集群或集群模板操作列的绑定,绑定EMR集群或集群模板。 
- 在弹出的对话框中,选择交换机和安全组,单击确定。 说明- 绑定集群大约需要5~10分钟,请耐心等待。 
 
- (可选)关联工作空间。 说明- 首次开通EMR Workflow服务时,将免费为您提供一个默认调度资源组。默认资源组开通时已自动关联至default工作空间。如果默认调度资源组不能满足您的需求,您也可以选择购买付费调度资源组。付费调度资源组的规格指标及计费规格详情,请参见调度资源组计费说明。付费调度资源组需要按照以下步骤关联工作空间。 - 在调度资源组页面,单击关联工作空间。 
- 在关联工作空间对话框中,单击对应工作空间操作列的关联。 
- 在弹出的对话框中,单击确定,即可将调度资源组绑定至此工作空间。 
 
步骤二:新建项目
- 在Workflow页面,在工作空间页签,单击目标工作空间操作列的控制台。 
- 在项目管理页面,单击创建项目。 
- 在弹出的对话框中,输入项目名称,单击确定。 
步骤三:创建工作流
步骤四:运行工作流
- 在工作流定义页面,单击目标工作流定义操作列的运行。 
- 在弹出的对话框中,在调度资源组下拉列表中选择调度资源组,单击确定。 
步骤五:查看任务实例日志
- 在左侧导航栏,选择实例运维>工作流实例,可以查看实例的运行状况。 
- 在左侧导航栏,选择实例运维>任务实例。 
- 在任务实例页面,单击目标任务名称操作列的查看日志,可以查看任务节点的运行日志。 
(可选)步骤六:定时工作流
- 在工作流定义页面,单击目标工作流定义操作列的定时。 
- 在弹出的对话框中,设置相关参数,单击确定。 - 起止时间:在起止时间范围内,定时运行工作流;不在起止时间范围内,不再产生定时工作流实例。 
- 定时:选择执行的时间。 
 
- 开启目标工作流定时状态列的开关。 
常见问题
相关文档
- EMR Workflow的更多介绍,请参见什么是EMR Workflow。 
- 更多任务类型的详细信息,请参见任务类型。 
- 工作流相关的操作,请参见管理工作流。