SparkSQL开发

更新时间:2025-04-23 01:41:45

本文介绍如何在阿里云EMR Serverless Spark环境中开发SparkSQL任务,并指导您如何访问Spark UI以查看任务详情。

前提条件

已创建工作空间和SQL会话实例,详情请参见创建工作空间管理SQL会话

创建SQL任务

  1. 进入开发页面。

    1. 登录E-MapReduce控制台

    2. 在左侧导航栏,选择EMR Serverless > Spark

    3. Spark页面,单击目标工作空间名称。

    4. EMR Serverless Spark页面,单击左侧导航栏中的数据开发

  2. 新建任务。

    1. 开发目录页签下,单击image(新建)图标。

    2. 在弹出的对话框中,输入名称,类型选择SQL > SparkSQL,然后单击确定

    3. 在右上角选择数据目录、数据库和一个已启动的SQL会话实例。

      您也可以在下拉列表中选择创建SQL会话,直接创建一个新的SQL会话实例。SQL会话更多介绍,请参见管理SQL会话

      image

    4. 在新建的任务编辑器中输入SQL语句。

    5. (可选)在开发页面右侧,您可以单击版本信息页签,查看版本信息。

      您可以在此处查看或对比任务版本信息,支持对SQL代码内容进行版本间的对比,并将不同之处进行标记。

  3. 运行并发布任务。

    1. 单击运行

      返回结果信息可以在下方的运行结果中查看。如果有异常,则可以在运行问题中查看。

    2. 确认运行无误后,单击右上角的发布

    3. 发布对话框中,可以输入发布信息,然后单击确定

访问Spark UI

通过Spark UI,您可以查看任务的执行情况、资源使用情况、日志信息等,从而更好地分析和优化Spark任务。

在运行结果区域访问
在会话实例处访问
说明

仅以下引擎版本支持该功能:

  • esr-4.x:esr-4.2.0及之后版本。

  • esr-3.x:esr-3.2.0及之后版本。

  • esr-2.x:esr-2.6.0及之后版本。

执行完SQL语句后,您可以在运行结果页签的最下方,单击Spark UI,系统将自动跳转至Spark UI页面。

image

执行完SQL语句后,您可以在会话实例处,选择image > Spark UI,系统将自动跳转至Spark UI页面。

image

后续操作

创建完任务后,您可以创建工作流来定期调度任务,详情请参见创建工作流。工作流的完整调度示例,请参见SparkSQL开发快速入门

  • 本页导读 (1)
  • 前提条件
  • 创建SQL任务
  • 访问Spark UI
  • 后续操作
AI助理

点击开启售前

在线咨询服务

你好,我是AI助理

可以解答问题、推荐解决方案等