数据集是基于特定数据库和SQL查询生成,并且以二维表呈现的一种数据集合。本文介绍创建、编辑、删除数据集的方法。
注意事项
数据分析后续所有的分析工作、仪表盘制作和大屏制作都是基于数据集进行的,因此在进行其他功能前,必须先创建数据集。
创建数据集
方式一:通过控制台顶部菜单栏操作创建数据集
- 登录数据管理DMS 5.0。
单击控制台左上角的图标,选择
。说明若您使用的是非极简模式的控制台,在顶部菜单栏中,选择
。进入数据分析页面,单击数据集页签。
单击新建数据集,配置如下信息:
配置项
是否必填
说明
名称
是
数据集名称,且在同一个用户下唯一。
描述
否
用于描述数据集的属性。
数据库
是
执行数据查询的目标数据库。您需要有该数据库的查询权限。
变量
否
变量用于在仪表盘展示时,通过动态传入变量值替换数据集中SQL引用的变量,达到筛选数据的目的。
SQL
是
查询数据对应的
SELECT SQL
,可自由输入任意可正常执行的查询SQL。说明如果需要在展示图表时进行数据筛选,可在SQL中引用变量,引用变量的方式为
$变量名$
。在页面下方,单击执行。
调整数据集模型。
在SQL执行成功后,可以看到数据预览,在数据集预览区域,可以调整任意字段的数据类型和可视化类型。
数据类型:字符串、数字、日期、省份、城市、邮编、布尔。
可视化类型:维度、度量。
说明DMS数据分析在SQL执行成功后,会基于各个字段的SQL数据类型和执行结果数据推测出合适的数据集模型,即区分字段是维度还是度量,因此在SQL执行成功后,您可以对数据类型和可视化类型进行验证和调整(如将字段数据类型调整为国家、省份、城市等地理位置数据类型),也可以直接依赖推荐出的模型,进行下一步操作。
单击保存,完成数据集的创建,并返回到数据分析页面。
方式二:通过SQL Console控制台快速创建数据集
- 登录数据管理DMS 5.0。
在控制台首页左侧实例导航栏中,选择目标实例,并右键双击目标数据库,进入SQL Console页面。
说明您还可以通过控制台顶部菜单栏操作进入SQL Console页面,选择
,选择数据库,再单击确认。在命令执行区域输入SQL语句,单击执行。
在执行结果区域,单击一键可视化。
系统将基于此SQL查询语句完成数据集的创建、仪表盘集合的创建,并自动进入仪表盘编辑页面。
说明一键可视化自动创建的数据集和仪表盘的名称、描述格式如下:
仪表盘名称:未命名仪表盘门户_时间戳。
默认的仪表盘描述为空,您可根据需要自行设置。
数据集名称:新建数据集_数据库ID_时间戳。
数据集描述:SQL Console一键可视化数据集。
单击仪表盘页面左上角的图标,返回至数据分析首页。
单击数据集页签,您可看到已创建的数据集。
编辑数据集
- 登录数据管理DMS 5.0。
单击控制台左上角的图标,选择
。说明若您使用的是非极简模式的控制台,在顶部菜单栏中,选择
。进入数据分析页面,单击数据集页签。
选择目标数据集行,单击操作列下的图标,进入编辑数据集页面。
调整数据集名称、描述或SQL字段等信息。
单击执行,此时会执行SQL查询语句。
单击保存,完成创建数据集操作,并返回到数据分析页面。
删除数据集
- 登录数据管理DMS 5.0。
单击控制台左上角的图标,选择
。说明若您使用的是非极简模式的控制台,在顶部菜单栏中,选择
。进入数据分析页面,单击数据集页签。
选择目标数据集行,单击操作列下的图标。
在确认删除此数据集吗?对话框中,单击是。
重要数据集删除后不可恢复,请谨慎操作。
数据集变量
变量的作用
可以实现查询数据集SQL动态化。
可以在仪表盘中指定变量值来调整数据集的SQL。
可以在仪表盘中使用数据集变量对数据进行筛选。
定义变量
- 登录数据管理DMS 5.0。
单击控制台左上角的图标,选择
。说明若您使用的是非极简模式的控制台,在顶部菜单栏中,选择
。进入数据分析页面,单击数据集页签。
选择目标数据集行,单击操作列下的图标,进入编辑数据集页面。
在数据集编辑页面,单击增加,新增查询变量。
在变量编辑对话框中,填写变量参数。
变量
是否必填
说明
名称
是
输入变量名称。
别名
否
输入变量名称的别名。
值类型
是
选择值的类型,例如字符串、数值、日期、SQL表达式,并配置该类型的变量。
说明在SQL表达式中引用字符串类型的变量时,需要加半角单引号
('')
。例如name ='$var1$'
。使用表达式
否
除通过直接增加默认值的方式外,还可以使用SQL表达式来定义变量的默认值。以值类型选择日期为例:
DATE(DATE_SUB(now(),INTERVAL 7 DAY));
默认值
否
单击增加,增加指定类型的默认值。
单击确认,完成变量创建。
使用变量
若您在变量编辑对话框中已设置变量的默认值,则可以在新建SQL数据集中直接使用此变量。使用变量的格式为
$变量名称$
。代码示例如下:
SELECT * FROM `example_table` WHERE region = $diyu$;
若您在变量编辑对话框中未设置变量的默认值,则可以在新建SQL数据集页面的SQL栏中使用条件分支进行变量筛选。使用变量的格式为
$if(变量)$
、$endif$
。代码示例如下:SELECT * FROM `example_table` WHERE 1 = 1 $if(diyu)$ and region = $diyu$ $endif$
if、elseif判断逻辑,若满足层级1则直接返回数据;若不满足层级1,则判断是否满足层级2,若满足,则返回数据;若都不满足,则不执行if语句。
层级1:变量关联仪表盘上的全局筛选器。
层级2:变量已设置默认值。
若您在变量编辑对话框中设置部分变量的默认值,则可以在新建SQL数据集页面的SQL栏中使用条件分支进行变量筛选。使用变量的格式为
$if(变量)$
、$elseif(变量)$
、$else$
、$endif$
。代码示例如下:
SELECT * FROM `example_table` WHERE 1 = 1 $if(diyu)$ and region = $diyu$ /*条件1:若满足判断逻辑的其中一个层级,则判断表中字段值与变量默认值一致,返回表中符合条件的数据。*/ $elseif(date)$ and order_date > $date$ /*条件2:若满足判断逻辑的其中一个层级,则判断表中order_date字段值与变量默认值是否一致,一致时返回所有满足条件的数据。*/ $else$ and order_date is not null /*若条件1和条件2都不满足,则返回表中order_date字段不为空的数据。*/ $endif$
if、elseif判断逻辑,若满足层级1则直接返回数据;若不满足层级1,则判断是否满足层级2,若满足,则返回数据;若都不满足,则不执行if语句。层级1:变量关联仪表盘上的全局筛选器。层级2:变量已设置默认值。