在DataV-Note(智能分析)的分析单元中,数据集将作为您进行查询分析的数据来源,变量则可用于构建联动查询,帮助您动态更新及筛选相关数据。本文为您介绍如何使用及管理数据集和变量。
使用须知
为确保相关操作能够顺利执行,在使用数据集和变量之前,请务必先了解以下内容。
原始数据集:是用于进行查询分析的原始数据,包括数据库和文件数据集。
查询结果集:是基于数据库、文件数据集等原始数据,通过指定条件筛选、处理生成的结果数据。该类数据可在SQL、Python等分析单元中进行二次分析,也可作为可视化分析单元(例如,图表)的输入数据。
变量:是运行分析单元后输出的结果的集合(例如,SQL查询结果、过滤器生成的结果、控件输出的参数等),可供SQL、Python等引用,构建联动查询。
前提条件
进入项目编辑页面
在
页签,鼠标悬停至目标项目,单击编辑,进入该项目的编辑页面。
使用原始数据集
使用原始数据集进行查询分析及可视化展示的通用步骤如下:
创建分析单元。
选择数据集进行查询分析。
您可按需选择数据库、文件数据集作为数据来源,并结合相关查询语句,进行分析及可视化展示。
数据库、文件数据集的使用操作,请参见下文。
示例使用SQL对数据集进行查询分析的步骤如下。
使用数据库
在连通性校验成功),您可基于该数据进行查询分析及可视化展示。
区域,将展示已成功连接的数据源(即数据源的全量数据源列表(包含连接成功、连接异常、未检测连通性等所有状态的数据源)请移至数据源管理目录查看。
若当前没有合适的数据源,也可单击
图标,按照界面指引新建。
示例:使用SQL分析单元查询Hologres数据源中
nation
表的数据。使用文件数据集
在
目录,将为您展示已导入的本地文件数据,您可基于该数据进行查询分析及可视化展示。若无可用文件,可单击
图标,按照界面指引上传,详情请参见添加文件数据。
若上传的Excel文件包含多个Sheet,则编写的SQL查询代码需指明查询哪个Sheet的数据。
示例:使用SQL分析单元查询Excel表的数据,并进行图表展示。
使用查询结果集
查询结果集通常为分析报告最终需要展示的数据,可基于该数据在SQL、Python等分析单元中进行二次整合分析,也可将该数据作为图表、表格、地图、交叉表进行可视化展示的输入数据。
生成查询结果集。
您需先基于数据库或文件数据集进行查询分析,其分析结果将视为一个查询结果集。
生成的查询结果集可在左侧
目录查看。示例基于文件数据集进行查询分析,生成查询结果集,操作如下。
可按需更改查询结果集(序号3)的类型,支持的类型如下:
普通视图(View):依赖该视图的查询都将直接从源表(即文件数据集或数据库的原始数据)中获取相应数据。
缓存视图(CachedView):该视图会将相关数据缓存至Note本地,用于加速查询,减轻源表压力。
Pandas的数据集(DataFrame):支持在Python分析单元中使用Pandas操作数据。
基于查询结果集进行分析。
可视化分析:可按需创建可视化分析单元,选择某个具体的查询结果集进行可视化展示。示例通过堆叠条形图展示
retail
查询结果集的数据。
管理数据集
在数据集列表,可执行如下管理操作。不同类型的数据集支持执行的操作存在差异,具体请以实际界面为准。
使用变量
在项目编辑页面左侧导航栏,单击图标,进入变量页签。当前项目中所有分析单元的输出结果(例如,SQL查询、过滤器生成的查询结果集、控件输出的参数等)将作为变量呈现,可在SQL分析、Python分析、可视化分析中引用,构建联动查询。
- 本页导读 (1)
- 使用须知
- 前提条件
- 进入项目编辑页面
- 使用原始数据集
- 使用数据库
- 使用文件数据集
- 使用查询结果集
- 管理数据集
- 使用变量