文档

管理数据集

更新时间:

数据集是基于特定数据库和SQL查询生成,并且以二维表呈现的一种数据集合。本文介绍创建、编辑、删除数据集的方法。

注意事项

数据分析后续所有的分析工作、仪表盘制作和大屏制作都是基于数据集进行的,因此在进行其他功能前,必须先创建数据集。

创建数据集

方式一:通过控制台顶部菜单栏操作创建数据集

  1. 登录数据管理DMS 5.0
  2. 在顶部菜单栏中,选择集成与开发(DTS) > 数据应用 > 数据分析

  3. 进入数据分析页面,单击数据集页签。

    数据集

  4. 单击新建数据集,配置如下信息:

    配置项

    是否必填

    说明

    名称

    数据集名称,且在同一个用户下唯一。

    描述

    用于描述数据集的属性。

    数据库

    执行数据查询的目标数据库。您需要有该数据库的查询权限。

    变量

    变量用于在仪表盘展示时,通过动态传入变量值替换数据集中SQL引用的变量,达到筛选数据的目的。

    SQL

    查询数据对应的SELECT SQL,可自由输入任意可正常执行的查询SQL。

    说明

    如果需要在展示图表时进行数据筛选,可在SQL中引用变量,引用变量的方式为$变量名$

  5. 在页面下方,单击执行

  6. 调整数据集模型。

    在SQL执行成功后,可以看到数据预览,在数据集预览区域,可以调整任意字段的数据类型和可视化类型。

    • 数据类型:字符串、数字、日期、省份、城市、邮编、布尔。

    • 可视化类型:维度、度量。

    xiugaileixing

    说明

    DMS数据分析在SQL执行成功后,会基于各个字段的SQL数据类型和执行结果数据推测出合适的数据集模型,即区分字段是维度还是度量,因此在SQL执行成功后,您可以对数据类型和可视化类型进行验证和调整(如将字段数据类型调整为国家、省份、城市等地理位置数据类型),也可以直接依赖推荐出的模型,进行下一步操作。

  7. 单击保存,完成数据集的创建,并返回到数据分析页面。

方式二:通过SQL Console控制台快速创建数据集

  1. 登录数据管理DMS 5.0
  2. 在控制台首页左侧实例导航栏中,选择目标实例,并右键双击目标数据库,进入SQL Console页面。

    说明

    您还可以通过控制台顶部菜单栏操作进入SQL Console页面,选择SQL窗口 > SQL窗口,选择数据库,再单击确认

  3. 在命令执行区域输入SQL语句,单击执行

  4. 在执行结果区域,单击一键可视化

    系统将基于此SQL查询语句完成数据集的创建、仪表盘集合的创建,并自动进入仪表盘编辑页面。

    说明

    一键可视化自动创建的数据集和仪表盘的名称、描述格式如下:

    • 仪表盘名称:未命名仪表盘门户_时间戳。

    • 默认的仪表盘描述为空,您可根据需要自行设置。

    • 数据集名称:新建数据集_数据库ID_时间戳。

    • 数据集描述:SQL Console一键可视化数据集。

  5. 单击仪表盘页面左上角的fanhui图标,返回至数据分析首页。

  6. 单击数据集页签,您可看到已创建的数据集。

编辑数据集

  1. 登录数据管理DMS 5.0
  2. 在顶部菜单栏中,选择集成与开发(DTS) > 数据应用 > 数据分析

  3. 进入数据分析页面,单击数据集页签。

  4. 选择目标数据集行,单击操作列下的bianji图标,进入编辑数据集页面。

  5. 调整数据集名称、描述或SQL字段等信息。

  6. 单击执行,此时会执行SQL查询语句。

  7. 调整数据集模型

  8. 单击保存,完成创建数据集操作,并返回到数据分析页面。

删除数据集

  1. 登录数据管理DMS 5.0
  2. 在顶部菜单栏中,选择集成与开发(DTS) > 数据应用 > 数据分析

  3. 进入数据分析页面,单击数据集页签。

  4. 选择目标数据集行,单击操作列下的shanchu图标。

  5. 确认删除此数据集吗?对话框中,单击

    重要

    数据集删除后不可恢复,请谨慎操作。

数据集变量

变量的作用

  • 可以实现查询数据集SQL动态化。

  • 可以在仪表盘中指定变量值来调整数据集的SQL。

  • 可以在仪表盘中使用数据集变量对数据进行筛选。

定义变量

  1. 登录数据管理DMS 5.0
  2. 在顶部菜单栏中,选择集成与开发(DTS) > 数据应用 > 数据分析

  3. 进入数据分析页面,单击数据集页签。

  4. 选择目标数据集行,单击操作列下的bianji图标,进入编辑数据集页面。

  5. 在数据集编辑页面,单击增加,新增查询变量。

  6. 变量编辑对话框中,填写变量参数。

    变量

    是否必填

    说明

    名称

    输入变量名称。

    别名

    输入变量名称的别名。

    值类型

    选择值的类型,例如字符串、数值、日期、SQL表达式,并配置该类型的变量。

    说明

    在SQL表达式中引用字符串类型的变量时,需要加半角单引号('')。例如name ='$var1$'

    使用表达式

    除通过直接增加默认值的方式外,还可以使用SQL表达式来定义变量的默认值。以值类型选择日期为例:

    DATE(DATE_SUB(now(),INTERVAL 7 DAY));

    默认值

    单击增加,增加指定类型的默认值。

  7. 单击确认,完成变量创建。

使用变量

  • 若您在变量编辑对话框中已设置变量的默认值,则可以在新建SQL数据集中直接使用此变量。使用变量的格式为$变量名称$dandudiyu

    代码示例如下:

    SELECT * FROM `example_table` WHERE region = $diyu$;
  • 若您在变量编辑对话框中未设置变量的默认值,则可以在新建SQL数据集页面的SQL栏中使用条件分支进行变量筛选。使用变量的格式为$if(变量)$$endif$定义代码示例如下:

    SELECT * FROM `example_table`
    WHERE 1 = 1
    $if(diyu)$        
    and region = $diyu$
    $endif$

    if、elseif判断逻辑,若满足层级1则直接返回数据;若不满足层级1,则判断是否满足层级2,若满足,则返回数据;若都不满足,则不执行if语句。

    • 层级1:变量关联仪表盘上的全局筛选器。

    • 层级2:变量已设置默认值。

  • 若您在变量编辑对话框中设置部分变量的默认值,则可以在新建SQL数据集页面的SQL栏中使用条件分支进行变量筛选。使用变量的格式为$if(变量)$$elseif(变量)$$else$$endif$duofenzhi

    代码示例如下:

    SELECT * FROM `example_table`
    WHERE 1 = 1
    $if(diyu)$
    and region = $diyu$   /*条件1:若满足判断逻辑的其中一个层级,则判断表中字段值与变量默认值一致,返回表中符合条件的数据。*/
    $elseif(date)$
    and order_date > $date$  /*条件2:若满足判断逻辑的其中一个层级,则判断表中order_date字段值与变量默认值是否一致,一致时返回所有满足条件的数据。*/
    $else$  
    and order_date is not null   /*若条件1和条件2都不满足,则返回表中order_date字段不为空的数据。*/
    $endif$

    if、elseif判断逻辑,若满足层级1则直接返回数据;若不满足层级1,则判断是否满足层级2,若满足,则返回数据;若都不满足,则不执行if语句。层级1:变量关联仪表盘上的全局筛选器。层级2:变量已设置默认值。

  • 本页导读 (1)
文档反馈