通过PostgreSQL创建实时数据集

Dataphin标签支持通过以SQL方式对PostgreSQL数据源表字段进行解析,定义数据集指标。本文将指导您如何通过PostgreSQL创建和配置实时数据集。

前提条件

  • 创建实时数据集前请先创建数据集所归属的标签项目。更多信息,请参见创建标签项目

  • 通过PostgreSQL创建实时数据集前请先创建用于实时数据集的PostgreSQL数据源。具体操作,请参见创建PostgreSQL数据源

操作步骤

  1. 在Dataphin首页,单击顶部菜单栏的标签->标签工作台

  2. 按照以下操作指引,进入新增实时数据集对话框。

    选择标签项目->单击实时数据集->单击新增数据集

    image

  3. 新增实时数据集对话框中,选择PostgreSQL数据集

    image

  4. 新增PostgreSQL配置页面,配置数据集的基本信息。

    参数

    描述

    数据集名称

    填写数据集的名称信息。支持中英文、数字、下划线(_),64个字符以内。

    数据集code

    实时数据集的唯一标识。在存在相同实时数据集名称时,可帮助您定位具体实时数据集。必须以字母开头,允许小写英文字母、数字、下划线(_),64个字符以内。

    负责人

    请选择该实时数据集的负责人。

    描述

    填写实时数据集的简单描述,1000个字符以内。

  5. 配置实时数据集的加工逻辑

    参数

    描述

    数据源

    选择所需加工的PostgreSQL数据源。

    加工逻辑(SQL)

    选择数据源后,填写SQL加工逻辑。

    • SQL的SELECT字段中必须选择一个字段作为实时标签查询服务的入参。

    • SQL中必须有变量作为主键,格式为${parameter}

    • 配置示例:

      SELECT pk, indicatorA, indicatorB FROM source_table where pk = ${parameter}

    指标配置

    请先选择数据源,并输入SQL加工逻辑后单击指标解析。根据解析出的字段名称配置对应的主键/指标展示名称、值类型和描述。值类型支持字符串、长整型、双精度浮点数、日期、布尔、十进制小数

    若需配置多个指标,您可单击+添加进行配置。

  6. 单击发布,完成实时数据集创建。

    说明

    保存成功后,单击验证。您可以根据配置的加工逻辑输入参数值,以验证您的加工逻辑是否正确。

后续步骤

完成实时数据集的创建和发布后,您可以为您的实时数据集创建对应的实时标签。具体操作,请参见实时标签概述