Zeppelin的Hive解释器是使用JDBC连接HiveServer2。本文为您介绍如何在Zeppelin中使用Hive。
背景信息
EMR数据开发的Zeppelin在以下两方面做了增强:
- 在多个EMR集群中动态切换。
- 您无需配置,所有配置都是自动完成。
Zeppelin的Hive解释器提供以下主要功能:
- 支持任何Hive SQL语句(包括DDL和DML等)。
Hive解释器与Beeline支持的语言及功能一样。
- 支持一个段落编写多条SQL语句,每条SQL语句以分号(;)结尾,按照从上到下的顺序执行。
- 支持注释功能。
- 支持并发执行多个段落。
- 支持参数功能。
- 支持图表展示SQL结果。
示例
- 多行SQL
如下图所示,在一个段落里执行2句SQL语句(以分号间隔),第一句切换执行引擎,第二句运行Select语句。
- 注释
以
--
开头的均为SQL注释。 - 参数功能
Zeppelin支持${var=value} 形式的差数。var是变量名,value是默认值。
例如,通常不使用变量时的查询SQL语句如下:select count(1) from orders where o_totalprice < 10000;
在Zeppelin中使用${var=value} 形式的参数查询语句时,设置变量名为price,默认值是10000,此时页面上会显示一个文本框,您可以在文本框里填写任意值,按回车键,即使用文本框里的值替换变量price并运行SQL语句。例如,填写的值为50000,运行的SQL语句如下图所示: - 图表展示SQL结果
Zeppelin内置了很多图表,您可以通过图表方式展示SQL结果。如下图所示,通过柱状图展示一个GROUP BY语句的结果。
内置教程
EMR数据开发集群自带了很多开发教程,详细信息请在如下图页面查看。