通过Zeppelin Livy Interpreter连接EMR Serverless Spark_开源大数据平台 E-MapReduce(EMR)-阿里云帮助中心

Zeppelin提供了一个交互式开发环境，使用户能够在Web界面中编写代码、运行查询并进行数据可视化分析。本文将介绍如何通过Zeppelin的Livy Interpreter连接Serverless Spark，从而高效构建和优化交互式开发环境。

前提条件

在将Interpreter Group设置为livy后，您需要配置如下参数信息。

涉及参数如下表所示。您也可以根据业务需求设置页面中的其他参数，更多关于参数的解释说明，请参见Apache Zeppelin官方文档。

参数	说明

参数	说明
zeppelin.livy.url	Livy的URL，填写格式为`http://{endpoint}`，其中`{endpoint}`为您创建的Livy Gateway的Endpoint（内网）信息。
zeppelin.livy.session.create_timeout	Zeppelin等待的最大时间（以秒为单位），建议设置为600秒。
zeppelin.livy.http.headers	HTTP请求的自定义头信息。需要单击图标新增该配置，填写为`x-acs-spark-livy-token:{token}`。其中`{token}`为您在Token管理页签创建的Token信息。

在页面上方单击Notebook，选择Create new note。
自定义Note Name，并将Default Interpreter选择为上文创建的Interpreter，本文示例为mylivy。
单击Create。
在新建的Notebook中输入以下代码，启动一个Spark Session。
首次启动所需时间为1~3分钟，其中%pyspark表示Python环境，%spark表示Scala环境。
```
%pyspark
```
Spark Session启动后，可以看到Spark UI的链接，并且可以正常执行代码，支持Python与Scala的混合编写。
在新建的Notebook中输入以下代码，查询当前Spark环境中可用的数据库列表。
```
%pyspark

spark.sql("show databases").show()
```
返回信息如下图所示。
（可选）查看Session信息。
当您通过Livy创建Spark Session后，该Session的相关信息（例如Session ID、状态等）将显示在列表中。
1. 在Livy Gateway页面，单击目标Gateway的名称。
2. 单击Session 列表页签。
  在该页面，您可以查看通过该Livy创建的Spark Session相关信息。