EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据仓库,并为生产任务的稳定运行提供保障。本文以HIVECLI任务类型为例,为您介绍如何快速使用EMR Workflow。
前提条件
已完成系统角色授权,详情请参见EMR Workflow角色授权。
已在EMR on ECS页面创建集群或集群模板,详情请参见创建集群或创建集群模板。
支持绑定的集群类型为DataLake、Hadoop和Custom。
步骤一:绑定集群和关联工作空间
使用阿里云账号(主账号)或RAM用户登录E-MapReduce控制台。
在左侧导航栏,选择EMR Workbench > Workflow。
在Workflow页面,单击调度资源组。
绑定集群或集群模板。
在调度资源组页面,单击目标资源组操作列的绑定集群。
在绑定 EMR 集群 / 集群模板对话框中,单击目标集群或集群模板操作列的绑定,绑定EMR集群或集群模板。
在弹出的对话框中,选择交换机和安全组,单击确定。
绑定集群大约需要5~10分钟,请耐心等待。
(可选)关联工作空间。
首次开通EMR Workflow服务时,将免费为您提供一个默认调度资源组。默认资源组开通时已自动关联至default工作空间。如果默认调度资源组不能满足您的需求,您也可以选择购买付费调度资源组。付费调度资源组的规格指标及计费规格详情,请参见调度资源组计费说明。付费调度资源组需要按照以下步骤关联工作空间。
在调度资源组页面,单击关联工作空间。
在关联工作空间对话框中,单击对应工作空间操作列的关联。
在弹出的对话框中,单击确定,即可将调度资源组绑定至此工作空间。
步骤二:新建项目
在Workflow页面,在工作空间页签,单击目标工作空间操作列的控制台。
在项目管理页面,单击创建项目。
在弹出的对话框中,输入项目名称,单击确定。
步骤三:创建工作流
步骤四:运行工作流
在工作流定义页面,单击目标工作流定义操作列的运行。
在弹出的对话框中,在调度资源组下拉列表中选择调度资源组,单击确定。
步骤五:查看任务实例日志
在左侧导航栏,选择实例运维>工作流实例,可以查看实例的运行状况。
在左侧导航栏,选择实例运维>任务实例。
在任务实例页面,单击目标任务名称操作列的查看日志,可以查看任务节点的运行日志。
(可选)步骤六:定时工作流
在工作流定义页面,单击目标工作流定义操作列的定时。
在弹出的对话框中,设置相关参数,单击确定。
起止时间:在起止时间范围内,定时运行工作流;不在起止时间范围内,不再产生定时工作流实例。
定时:选择执行的时间。
开启目标工作流定时状态列的开关。
常见问题
相关文档
EMR Workflow的更多介绍,请参见什么是EMR Workflow。
更多任务类型的详细信息,请参见任务类型。
工作流相关的操作,请参见管理工作流。
- 本页导读 (1)
- 前提条件
- 步骤一:绑定集群和关联工作空间
- 步骤二:新建项目
- 步骤三:创建工作流
- 步骤四:运行工作流
- 步骤五:查看任务实例日志
- (可选)步骤六:定时工作流
- 常见问题
- 相关文档