Apache Zeppelin是一款基于Web的Notebook产品,能够交互式数据分析。使用Zeppelin,您可以使用丰富的预构建语言后端(或解释器)制作交互式的协作文档,例如Scala、Python、SparkSQL、Hive等。Hologres兼容PostgreSQL ,支持直接连接Apache Zeppelin进行数据分析。本文为您介绍Apache Zeppelin如何连接Hologres并可视化分析。
使用限制
最新版的Apache Zeppelin中,PostgreSQL解释器已被弃用,并合并到JDBC解释器中。您可以使用具有相同功能的JDBC Interpreter对接Hologres。
Apache Zeppelin连接Hologres
-
安装Apache Zeppelin。
安装Apache Zeppelin,详情请参见Apache Zeppelin官方文档。
-
配置解释器。
-
登录Apache Zeppelin,单击右上方的用户名,从下拉菜单中选择Interpreter。
-
在页面右上角单击+Create,配置如下参数信息,创建一个新的Interpreter。参数包括 Interpreter Name(解释器名称)和 Interpreter group(解释器所属分组)。
-
Interpreter Name填写您自定义的名称。
-
在创建时,您需要将Interpreter Group设置为JDBC。
-
-
在将Interpreter Group设置为JDBC后,您需要配置如下参数信息。在 Properties 配置表中设置三项参数:default.url(JDBC 连接 URL)、default.user(JDBC 用户名)和 default.password(JDBC 用户密码)。
参数
说明
default.url
JDBC的URL,填写格式为
jdbc:postgresql://{host}:{port}/{database},其中各参数解释:-
host:Hologres实例的网络地址。您可以进入Hologres管理控制台的实例详情页,从网络信息区域获取网络地址。
-
port:Hologres实例的端口。您可以进入Hologres管理控制台的实例详情页,从网络信息区域获取实例端口。
-
database:Hologres创建的数据库名称。
default.user
当前阿里云账号的AccessKey ID。获取方式请参见创建访问密钥。
default.password
当前阿里云账号的AccessKey Secret。获取方式请参见创建访问密钥。
您也可以根据业务需求设置页面中的其它参数,更多关于参数的解释说明,请参见Apache Zeppelin官方文档。
-
-
单击页面下方的Save保存配置。
-
-
新建Notebook进行操作分析。
在Notebook编写SQL时,必须要在SQL前加入解释器的名称,例如
%hologres,以便Zeppelin使用指定的解释器生成并发送查询。您可以在页面指定数据展示类型,查询之后的结果将展示在页面下方。在 Notebook 中使用%hologres解释器执行 SQL 查询(例如select * from lineitem limit 10),查询状态显示 FINISHED 后,可通过可视化类型切换按钮(表格、柱状图、饼图、面积图、折线图、散点图)选择图表类型。在 Pivot 配置区将字段拖入 keys(如l_shipmode)和 values(如l_quantity SUM)区域,即可生成按维度分组汇总的柱状图。