本文为您介绍如何通过析言GBI连接实时数仓Hologres,并通过自然语言完成数据分析。

背景信息

析言GBI是基于阿里云通义大语言模型在数据分析领域专门增强的原生数据助理,通过自然语言交互实现NL2SQL、数据问答、分析、洞察等多维度的大模型智能分析应用,适用于业务变化较快、数据分析时效性强的一线业务场景。详情请参见析言GBI产品简介

前提条件

  1. 开通Hologres实例,详情请参见购买Hologres

  2. 创建数据库,详情请参见创建数据库

操作步骤

Hologres数据准备

以下示例使用MaxCompute提供的公开数据集TPC-H的ORDERS表。您无需进行任何额外准备,只需运行以下SQL语句,即可通过MaxCompute外部表将ORDERS表的数据导入Hologres。

-- 创建外部表
IMPORT FOREIGN SCHEMA public_data
LIMIT TO (ORDERS_10g)
FROM SERVER odps_server INTO public options (if_table_exist 'update');

-- 创建内部表
BEGIN;
CREATE TABLE ORDERS (
    O_ORDERKEY bigint NOT NULL PRIMARY KEY,
    O_CUSTKEY int NOT NULL,
    O_ORDERSTATUS text NOT NULL,
    O_TOTALPRICE DECIMAL(12, 2) NOT NULL,
    O_ORDERDATE timestamptz NOT NULL,
    O_ORDERPRIORITY text NOT NULL,
    O_CLERK text NOT NULL,
    O_SHIPPRIORITY int NOT NULL,
    O_COMMENT text NOT NULL
);

CALL set_table_property ('ORDERS', 'segment_key', 'O_ORDERDATE');
CALL set_table_property ('ORDERS', 'distribution_key', 'O_ORDERKEY');
CALL set_table_property ('ORDERS', 'bitmap_columns', 'O_ORDERKEY,O_CUSTKEY,O_ORDERSTATUS,O_ORDERPRIORITY,O_CLERK,O_SHIPPRIORITY,O_COMMENT');
CALL set_table_property ('ORDERS', 'dictionary_encoding_columns', 'O_ORDERSTATUS,O_ORDERPRIORITY,O_CLERK,O_COMMENT');

COMMENT ON COLUMN ORDERS.O_ORDERKEY IS '订单编号';
COMMENT ON COLUMN ORDERS.O_CUSTKEY IS '顾客序号';
COMMENT ON COLUMN ORDERS.O_ORDERSTATUS IS '订单状态';
COMMENT ON COLUMN ORDERS.O_TOTALPRICE IS '总价';
COMMENT ON COLUMN ORDERS.O_ORDERDATE IS '下单日期';
COMMENT ON COLUMN ORDERS.O_ORDERPRIORITY IS '订单优先级';
COMMENT ON COLUMN ORDERS.O_CLERK IS '收银员';
COMMENT ON COLUMN ORDERS.O_SHIPPRIORITY IS '发货优先级';
COMMENT ON COLUMN ORDERS.O_COMMENT IS '备注';

COMMIT;

-- 数据导入内表
INSERT INTO ORDERS SELECT * FROM ORDERS_10g;

连接Hologres

析言GBI支持通过公网或VPC连接Hologres,详情请参见实例配置。具体操作模式如下:

  1. 进入百炼-应用广场,单击析言GBI下的查看详情

  2. 单击前往数据管理,根据连接方式,选择对应的数据库。

    • 如果您需要使用VPC连接Hologres,选择访问VPC数据库中的Hologres进行授权联接。连接的详情参见析言GBI反向网络访问VPC打通完成相关配置。

    • 如果您需要使用公网连接Hologres,选择访问公网数据库中的PostgreSQL进行授权联接。请确保在Hologres管理控制台实例详情网络信息中已手动开启公网。

    qwe

  3. 填入数据库配置参数和登录信息,单击授权联接

    image

    相关配置说明如下:

    参数名称

    说明

    IP/域名

    Hologres实例的域名。您可以进入Hologres管理控制台实例列表,选择对应实例,在实例详情网络信息中,选择公网指定VPC获取对应域名。

    端口号

    Hologres实例的网络端口。您可以进入Hologres管理控制台实例列表,选择对应实例,在实例详情网络信息中,选择公网指定VPC获取对应域名的端口。

    数据库名称

    需要连接的数据库名。您可以进入Hologres管理控制台前往HoloWeb,连接并登录对应实例,在已登录实例中查询对应数据库名。

    数据库Schema

    需要连接的数据库Schema。默认是public,您也可以填写其他Schema。

    数据库用户名

    当前账号的AccessKey ID。获取方式请参见AccessKey 管理

    数据库密码

    当前账号的AccessKey Secret。获取方式请参见创建访问密钥

  4. 单击右侧关联数据表,选择需要关联数据表的名称,单击确认关联

    完成数据表关联,可对数据表进行管理。

自然语言问答

单击析言GBI首页,您可以通过自然语言问答形式完成数据分析,在输入框中输入与所关联的数据表相关问题。例如“每年有多少笔订单?有多少笔最高优订单?”,结果如下图所示。

444444444475878

更多功能与操作

您可以进一步参考析言GBI使用指南,完成企业数据管理、模型优化案例管理、模型输出干预等高级操作。