构建模型

数据关联(JOIN)用来连接不同的数据表。在数据分析时,当需要分析的数据存储在不同的表,您可以通过数据关联,把多个表连接起来,形成模型进行数据分析。

前提条件

您已创建数据集,请参见创建并管理数据集

背景信息

Quick BI支持左外连接(LEFT JOIN)、内连接(INNER JOIN)、全连接(FULL JOIN),下面以学生表和课程的成绩表为例介绍构建模型的三种连接方式。连接方式

说明

上图仅为原理示意,实际关联后会保留关联表的原始列。

使用限制

  • 非同源数据表关联仅适用于专业版。

  • 跨源关联数据表需开启quick引擎抽取加速,适用于MySQL、SQL Server、AnalyticDB for MySQL 3.0、Oracle、MaxCompute、PostgreSQL、Hologres、Hive、AnalyticDB for PostgreSQL、PolarDB for MySQL和PolarDB for PostgreSQL数据源。

    说明

    自定义SQL创建的数据集与数据表不支持跨源关联。

  • MySQL数据源暂不支持全关联。

操作步骤

  1. 在数据集编辑页面,按照下图步骤,拖拽数据表至画布中。

    image
  2. 新增关联关系面板中,按照下图步骤配置数据关联。

    image
    说明
    • 关联关系支持配置为左外关联(左外)、内连接(内连接)、全连接(全连接)。

    • MySQL不支持全连接(全连接)。

    • 配置数据关联时,关联字段必须同时存在于被关联的数据表中。

配置完成后,您可以单击画布中的关联图标(例如关联图标)查看关联关系。

如果某个节点不需要,可鼠标悬浮在表上,单击删除图标(删除)。

说明

删除节点仅支持删除模型的最末节点。

自定义关联条件

配置关联条件时,支持创建自定义计算作为关联字段。

  1. 关联字段选择时,在下拉框里选择创建自定义计算image

  2. 输入字段表达式,单击确定。image

  3. 单击确定,您可以在关联字段里看到新建的字段表达式。image

  4. 您也可以编辑自定义计算。image

关联前过滤

关联时支持分别对两张表创建过滤条件,过滤操作将在关联前执行。image

  1. 单击关联字段对应表右边的image图标。

  2. 设置过滤条件。image

  3. 单击确定即可完成关联前过滤条件的设置。image

阿里云首页 Quick BI 相关技术圈