数据集是基于特定数据库和SQL查询生成,并且以二维表呈现的一种数据集合。本文介绍创建、编辑、删除数据集的方法。
注意事项
数据分析后续所有的分析工作、仪表盘制作和大屏制作都是基于数据集进行的,因此在进行其他功能前,必须先创建数据集。
创建数据集
方式一:通过控制台顶部菜单栏操作创建数据集
- 登录数据管理DMS 5.0。
- 在顶部菜单栏中,选择 。
- 进入数据分析页面,单击数据集页签。
- 单击新建数据集,配置如下信息:
配置项 是否必填 说明 名称 是 数据集名称,且在同一个用户下唯一。 描述 否 用于描述数据集的属性。 数据库 是 执行数据查询的目标数据库。您需要有该数据库的查询权限。 变量 否 变量用于在仪表盘展示时,通过动态传入变量值替换数据集中SQL引用的变量,达到筛选数据的目的。 SQL 是 查询数据对应的 SELECT SQL
,可自由输入任意可正常执行的查询SQL。说明 如果需要在展示图表时进行数据筛选,可在SQL中引用变量,引用变量的方式为$变量名$
。 - 在页面下方,单击执行。
- 调整数据集模型。在SQL执行成功后,可以看到数据预览,在数据集预览区域,可以调整任意字段的数据类型和可视化类型。
- 数据类型:字符串、数字、日期、省份、城市、邮编、布尔。
- 可视化类型:维度、度量。
说明 DMS数据分析在SQL执行成功后,会基于各个字段的SQL数据类型和执行结果数据推测出合适的数据集模型,即区分字段是维度还是度量,因此在SQL执行成功后,您可以对数据类型和可视化类型进行验证和调整(如将字段数据类型调整为国家、省份、城市等地理位置数据类型),也可以直接依赖推荐出的模型,进行下一步操作。 - 单击保存,完成数据集的创建,并返回到数据分析页面。
方式二:通过SQL Console控制台快速创建数据集
- 登录数据管理DMS 5.0。
- 在控制台首页左侧实例导航栏中,选择目标实例,并右键双击目标数据库,进入SQL Console页面。说明 您还可以通过控制台顶部菜单栏操作进入SQL Console页面,选择确认。,选择数据库,再单击
- 在命令执行区域输入SQL语句,单击执行。
- 在执行结果区域,单击一键可视化。系统将基于此SQL查询语句完成数据集的创建、仪表盘集合的创建,并自动进入仪表盘编辑页面。说明 一键可视化自动创建的数据集和仪表盘的名称、描述格式如下:
- 仪表盘名称:未命名仪表盘门户_时间戳。
- 默认的仪表盘描述为空,您可根据需要自行设置。
- 数据集名称:新建数据集_数据库ID_时间戳。
- 数据集描述:SQL Console一键可视化数据集。
- 单击仪表盘页面左上角的
图标,返回至数据分析首页。
- 单击数据集页签,您可看到已创建的数据集。
编辑数据集
- 登录数据管理DMS 5.0。
- 在顶部菜单栏中,选择 。
- 进入数据分析页面,单击数据集页签。
- 选择目标数据集行,单击操作列下的
图标,进入编辑数据集页面。
- 调整数据集名称、描述或SQL字段等信息。
- 单击执行,此时会执行SQL查询语句。
- 调整数据集模型。
- 单击保存,完成创建数据集操作,并返回到数据分析页面。
删除数据集
- 登录数据管理DMS 5.0。
- 在顶部菜单栏中,选择 。
- 进入数据分析页面,单击数据集页签。
- 选择目标数据集行,单击操作列下的
图标。
- 在确认删除此数据集吗?对话框中,单击是。重要 数据集删除后不可恢复,请谨慎操作。
数据集变量
变量的作用
- 可以实现查询数据集SQL动态化。
- 可以在仪表盘中指定变量值来调整数据集的SQL。
- 可以在仪表盘中使用数据集变量对数据进行筛选。
定义变量
- 登录数据管理DMS 5.0。
- 在顶部菜单栏中,选择 。
- 进入数据分析页面,单击数据集页签。
- 选择目标数据集行,单击操作列下的
图标,进入编辑数据集页面。
- 在数据集编辑页面,单击增加,新增查询变量。
- 在变量编辑对话框中,填写变量参数。
变量 是否必填 说明 名称 是 输入变量名称。 别名 否 输入变量名称的别名。 值类型 是 选择值的类型,例如字符串、数值、日期、SQL表达式,并配置该类型的变量。 说明 在SQL表达式中引用字符串类型的变量时,需要加半角单引号('')
。例如name ='$var1$'
。使用表达式 否 除通过直接增加默认值的方式外,还可以使用SQL表达式来定义变量的默认值。以值类型选择日期为例: DATE(DATE_SUB(now(),INTERVAL 7 DAY));
默认值 否 单击增加,增加指定类型的默认值。 - 单击确认,完成变量创建。
使用变量
- 若您在变量编辑对话框中已设置变量的默认值,则可以在新建SQL数据集中直接使用此变量。使用变量的格式为
$变量名称$
。代码示例如下:SELECT * FROM `example_table` WHERE region = $diyu$;
- 若您在变量编辑对话框中未设置变量的默认值,则可以在新建SQL数据集页面的SQL栏中使用条件分支进行变量筛选。使用变量的格式为
$if(变量)$
、$endif$
。代码示例如下:
SELECT * FROM `example_table` WHERE 1 = 1 $if(diyu)$ and region = $diyu$ $endif$
if、elseif判断逻辑,若满足层级1则直接返回数据;若不满足层级1,则判断是否满足层级2,若满足,则返回数据;若都不满足,则不执行if语句。- 层级1:变量关联仪表盘上的全局筛选器。
- 层级2:变量已设置默认值。
- 若您在变量编辑对话框中设置部分变量的默认值,则可以在新建SQL数据集页面的SQL栏中使用条件分支进行变量筛选。使用变量的格式为
$if(变量)$
、$elseif(变量)$
、$else$
、$endif$
。代码示例如下:SELECT * FROM `example_table` WHERE 1 = 1 $if(diyu)$ and region = $diyu$ /*条件1:若满足判断逻辑的其中一个层级,则判断表中字段值与变量默认值一致,返回表中符合条件的数据。*/ $elseif(date)$ and order_date > $date$ /*条件2:若满足判断逻辑的其中一个层级,则判断表中order_date字段值与变量默认值是否一致,一致时返回所有满足条件的数据。*/ $else$ and order_date is not null /*若条件1和条件2都不满足,则返回表中order_date字段不为空的数据。*/ $endif$
if、elseif判断逻辑,若满足层级1则直接返回数据;若不满足层级1,则判断是否满足层级2,若满足,则返回数据;若都不满足,则不执行if语句。层级1:变量关联仪表盘上的全局筛选器。层级2:变量已设置默认值。