本文介绍阿里云E-MapReduce如何访问Zeppelin。您可以通过访问Zeppelin,进行大数据可视化分析。
前提条件
- 已创建集群,并选择了Zeppelin服务,详情请参见创建集群。
- 在集群安全组中打开8080端口,详情请参见访问链接与端口。
- 已添加本文示例所需的服务,例如,Presto、Flink和Impala。
添加服务详情请参见添加服务。
访问Zeppelin
- 进入集群详情页面。
- 登录阿里云E-MapReduce控制台。
- 在顶部菜单栏处,根据实际情况选择地域和资源组。
- 单击上方的集群管理页签。
- 在集群管理页面,单击相应集群所在行的详情。
- 在左侧导航栏,单击访问链接与端口。
- 单击Zeppelin所在行的链接。
您可以直接访问Web UI页面。
示例
以下内容只适用于EMR-3.33.0及之后版本和EMR-4.6.0及之后版本:
如何使用Spark
- 在Zeppelin页面,单击Create new note。
- 在Create new note对话框,输入Note Name,选择Default Interpreter为spark。
- 单击create。
- 在Zeppelin的Notebook页面,您可以执行以下命令。
您无需配置,EMR里的Zeppelin中已经配置了Spark Interpreter。Spark默认执行模式是Yarn-cluster。支持以下三种代码方式:
- Spark Scala
%spark
表示执行Spark Scala代码。
%spark
val df = spark.read.options(Map("inferSchema"->"true","delimiter"->";","header"->"true"))
.csv("file:///usr/lib/spark-current/examples/src/main/resources/people.csv")
z.show(df)
df.registerTempTable("people")
返回信息如下所示。

- PySpark
%spark.pyspark
表示执行PySpark代码。
%spark.pyspark
df = spark.read.csv('file:///usr/lib/spark-current/examples/src/main/resources/people.csv',header=True,sep=';')
df.show()
返回信息如下所示。

- Spark SQL
%spark.sql
表示执行Spark SQL代码。
%spark.sql
show tables;
select * from people;
返回信息如下所示。

如何使用Flink
- 在Zeppelin页面,单击Create new note。
- 在Create new note对话框,输入Note Name,选择Default Interpreter为flink。
- 单击create。
- 在Zeppelin的Notebook页面,您可以执行以下命令。
您无需配置,EMR里的Zeppelin已经为您配置了Flink Interpreter。支持以下三种代码方式:
如何使用Presto
- 在Zeppelin页面,单击Create new note。
- 在Create new note对话框,输入Note Name,选择Default Interpreter为presto。
- 单击create。
- 在Zeppelin的Notebook页面,您可以执行以下命令查看表信息。
%presto
表示执行Presto SQL代码,您无需配置,Zeppelin会自动连接到EMR集群的Presto服务。
%presto
show tables;
select * from test_1;
返回信息如下所示。

如何使用Impala
- 在Zeppelin页面,单击Create new note。
- 在Create new note对话框,输入Note Name,选择Default Interpreter为impala。
- 单击create。
- 在Zeppelin的Notebook页面,您可以执行以下命令查看表信息。
%impala
表示执行Impala SQL代码,您无需配置,Zeppelin会自动连接到EMR集群的Impala服务。
%impala
drop table if exists test_1;
create table test_1(id int,name string);
insert into test_1 values(1,'test1');
insert into test_1 values(2,'test2');
select * from test_1;
返回信息如下所示。

如何使用Hive
- 在Zeppelin页面,单击Create new note。
- 在Create new note对话框,输入Note Name,选择Default Interpreter为hive。
- 单击create。
- 在Zeppelin的Notebook页面,您可以执行以下命令查看表信息。
%hive
表示执行Hive SQL代码,您无需配置,Zeppelin会自动连接到EMR集群的Hive Thrift Server服务。
%hive
show tables;
select * from test_1;
返回信息如下所示。
