本文介绍如何在阿里云EMR Serverless Spark环境中开发SparkSQL任务,并指导您如何访问Spark UI以查看任务详情。
前提条件
创建SQL任务
进入开发页面。
在左侧导航栏,选择
。在Spark页面,单击目标工作空间名称。
在EMR Serverless Spark页面,单击左侧导航栏中的数据开发。
新建任务。
在开发目录页签下,单击
(新建)图标。
在弹出的对话框中,输入名称,类型选择
,然后单击确定。在右上角选择数据目录、数据库和一个已启动的SQL会话实例。
您也可以在下拉列表中选择创建SQL会话,直接创建一个新的SQL会话实例。SQL会话更多介绍,请参见管理SQL会话。
在新建的任务编辑器中输入SQL语句。
(可选)在开发页面右侧,您可以单击版本信息页签,查看版本信息。
您可以在此处查看或对比任务版本信息,支持对SQL代码内容进行版本间的对比,并将不同之处进行标记。
运行并发布任务。
单击运行。
返回结果信息可以在下方的运行结果中查看。如果有异常,则可以在运行问题中查看。
确认运行无误后,单击右上角的发布。
在发布对话框中,可以输入发布信息,然后单击确定。
访问Spark UI
通过Spark UI,您可以查看任务的执行情况、资源使用情况、日志信息等,从而更好地分析和优化Spark任务。
仅以下引擎版本支持该功能:
esr-4.x:esr-4.2.0及之后版本。
esr-3.x:esr-3.2.0及之后版本。
esr-2.x:esr-2.6.0及之后版本。
执行完SQL语句后,您可以在运行结果页签的最下方,单击Spark UI,系统将自动跳转至Spark UI页面。
执行完SQL语句后,您可以在会话实例处,选择
,系统将自动跳转至Spark UI页面。后续操作
创建完任务后,您可以创建工作流来定期调度任务,详情请参见创建工作流。工作流的完整调度示例,请参见SparkSQL开发快速入门。
- 本页导读 (1)
- 前提条件
- 创建SQL任务
- 访问Spark UI
- 后续操作