EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据仓库,并为生产任务的稳定运行提供保障。本文以HIVECLI任务类型为例,为您介绍如何快速使用EMR Workflow。
前提条件
已完成系统角色授权,详情请参见EMR Workflow角色授权。
已在EMR on ECS页面创建集群或集群模板,详情请参见创建集群或创建集群模板。
支持绑定的集群类型为DataLake、Hadoop和Custom。
步骤一:绑定集群和关联工作空间
使用阿里云账号(主账号)或RAM用户登录E-MapReduce控制台。
在左侧导航栏,选择EMR Workbench > Workflow。
在Workflow页面,单击调度资源组。
绑定集群或集群模板。
在调度资源组页面,单击绑定集群。
在绑定EMR集群/集群模板对话框中,单击绑定,绑定EMR集群或集群模板。
在弹出的对话框中,选择交换机和安全组,单击确定。
说明绑定集群大约需要5~10分钟,请耐心等待。
(可选)关联工作空间。
说明首次开通EMR Workflow服务时,将免费为您提供一个默认调度资源组。默认资源组开通时已自动关联至default工作空间。如果默认调度资源组不能满足您的需求,您也可以选择购买付费调度资源组。付费调度资源组的规格指标及计费规格详情,请参见调度资源组计费说明。付费调度资源组需要按照以下步骤关联工作空间。
在调度资源组页面,单击关联工作空间。
在关联工作空间对话框中,单击对应工作空间操作列的关联。
在弹出的对话框中,单击确定,即可将调度资源组绑定至此工作空间。
步骤二:新建项目
在Workflow页面,单击工作空间。
单击工作空间操作列的控制台。
在项目管理页面,单击创建项目。
在弹出的对话框中,输入项目名称,单击确定。
步骤三:创建工作流
步骤四:运行工作流
在工作流定义页面,单击图标(上线)。
单击图标(运行)。
在弹出的对话框中,在调度资源组下拉列表中选择调度资源组,单击确定。
步骤五:查看任务实例日志
在左侧导航栏,选择实例运维>工作流实例,可以查看实例的运行状况。
在左侧导航栏,选择实例运维>任务实例。
在任务实例页面,单击目标任务名称操作列的图标(查看日志),可以查看任务节点的运行日志。
(可选)步骤六:下线工作流
在工作流定义页面,单击目标工作流操作列的(下线)。
常见问题
相关文档
EMR Workflow的更多介绍,请参见什么是EMR Workflow。
更多任务类型的详细信息,请参见任务类型。
工作流相关的操作,请参见管理工作流。