本文为您介绍Dataiku如何连接Hologres并可视化分析数据。
使用限制
由于Dataiku的限制,支持直接使用SQL Notebook查询外部表,但不支持使用Import tables to datasets查看外部表。
操作步骤
-
安装Dataiku
安装Dataiku,详情请参见Dataiku官方文档。
-
连接Hologres
-
登录Dataiku,单击Blank project创建一个项目,本示例的项目命名为Hologres。
-
在项目详情页面,单击+IMPORT YOUR FIRST DATASET进入数据源页面。
-
在数据源页面,选择SQL数据源类型下的PostgreSQL。在页面单击create a new connection。
-
在页面上方单击+NEW CONNECTION,从下拉框中选择PostgreSQL,创建新的连接。
-
根据需求填写BASIC PARAMS,如有需要您也可以填写schema参数。BASIC PARAMS 包含 Host、Database、Port、User 和 Password 五个字段,请根据 Hologres 实例信息填写。下方可通过 Advanced JDBC properties 添加额外属性(如 schema),或勾选 Use custom JDBC URL 自定义连接 URL。
具体参数配置如下所示:
参数
描述
New connection name
输入您的连接名称。
Host
Hologres实例的公共网络地址。您可以进入Hologres管理控制台的实例详情页,从网络信息区域获取网络地址。
Port
Hologres的实例端口。您可以进入Hologres管理控制台的实例详情页,从网络信息区域获取实例端口。
Database
Hologres的数据库名称。
User
当前阿里云账号的AccessKey ID。获取方式请参见创建访问密钥。
Password
当前阿里云账号的AccessKey Secret。获取方式请参见创建访问密钥。
更多参数
其余更多参数说明,请参见Dataiku官方文档。
-
参数填写完成后,单击页面下方的TEST,如果提示可以成功连接,您就可以单击CREATE创建连接。
-
-
数据分析
完成配置之后,您可以单击页面底部的Import tables to datasets批量导入数据库中的表结构到数据集。导入之后您可以进行数据分析,更多关于数据分析的操作请参见Dataiku官方文档。在 DSS 平台中打开 lineitem 数据集,选择 Charts 页签,将 Show Y 设置为
l_quantity (AVG),By X 设置为l_shipmode,And 设置为l_shipinstruct,生成按 shipmode 和 shipinstruct 维度展示平均数量的分组柱状图。