Dataiku

更新时间:
复制为 MD 格式

本文为您介绍Dataiku如何连接Hologres并可视化分析数据。

使用限制

由于Dataiku的限制,支持直接使用SQL Notebook查询外部表,但不支持使用Import tables to datasets查看外部表。

操作步骤

  1. 安装Dataiku

    安装Dataiku,详情请参见Dataiku官方文档

  2. 连接Hologres

    1. 登录Dataiku,单击Blank project创建一个项目,本示例的项目命名为Hologres。

    2. 在项目详情页面,单击+IMPORT YOUR FIRST DATASET进入数据源页面。

    3. 在数据源页面,选择SQL数据源类型下的PostgreSQL。在页面单击create a new connection

    4. 在页面上方单击+NEW CONNECTION,从下拉框中选择PostgreSQL,创建新的连接。

    5. 根据需求填写BASIC PARAMS,如有需要您也可以填写schema参数。BASIC PARAMS 包含 HostDatabasePortUserPassword 五个字段,请根据 Hologres 实例信息填写。下方可通过 Advanced JDBC properties 添加额外属性(如 schema),或勾选 Use custom JDBC URL 自定义连接 URL。

      具体参数配置如下所示:

      参数

      描述

      New connection name

      输入您的连接名称。

      Host

      Hologres实例的公共网络地址。您可以进入Hologres管理控制台的实例详情页,从网络信息区域获取网络地址。

      Port

      Hologres的实例端口。您可以进入Hologres管理控制台的实例详情页,从网络信息区域获取实例端口。

      Database

      Hologres的数据库名称。

      User

      当前阿里云账号的AccessKey ID。获取方式请参见创建访问密钥

      Password

      当前阿里云账号的AccessKey Secret。获取方式请参见创建访问密钥

      更多参数

      其余更多参数说明,请参见Dataiku官方文档

    6. 参数填写完成后,单击页面下方的TEST,如果提示可以成功连接,您就可以单击CREATE创建连接。

  3. 数据分析

    完成配置之后,您可以单击页面底部的Import tables to datasets批量导入数据库中的表结构到数据集。导入之后您可以进行数据分析,更多关于数据分析的操作请参见Dataiku官方文档。在 DSS 平台中打开 lineitem 数据集,选择 Charts 页签,将 Show Y 设置为 l_quantity (AVG)By X 设置为 l_shipmodeAnd 设置为 l_shipinstruct,生成按 shipmode 和 shipinstruct 维度展示平均数量的分组柱状图。