如何使用DataV-Note的数据集和变量进行查询分析_DataV数据可视化(DataV)-阿里云帮助中心

在DataV-Note（智能分析）的分析单元中，数据集将作为您进行查询分析的数据来源，变量则可用于构建联动查询，帮助您动态更新及筛选相关数据。本文为您介绍如何使用及管理数据集和变量。

使用须知

为确保相关操作能够顺利执行，在使用数据集和变量之前，请务必先了解以下内容。

原始数据集：是用于进行查询分析的原始数据，包括数据库和文件数据集。
- 数据库：其数据来源于数据库或数据仓库（例如，AnalyticDB MySQL、Hologres、MaxCompute）。使用前，需先在DataV-Note中创建相应数据源。
- 文件数据集：其数据来源于本地的数据文件（例如，Excel）。使用前，需先将本地文件导入至DataV-Note，详情请参见添加文件数据。
查询结果集：是基于数据库、文件数据集等原始数据，通过指定条件筛选、处理生成的结果数据。该类数据可在SQL、Python等分析单元中进行二次分析，也可作为可视化分析单元（例如，图表）的输入数据。
变量：是运行分析单元后输出的结果的集合（例如，SQL查询结果、过滤器生成的结果、控件输出的参数等），可供SQL、Python等引用，构建联动查询。

登录DataV-Note控制台。
在所有项目 > 全部页签，鼠标悬停至目标项目，单击编辑，进入该项目的编辑页面。
在该页面，您可使用原始数据集、查询结果集进行查询分析，或使用变量构建联动查询。

使用原始数据集进行查询分析及可视化展示的通用步骤如下：

查询结果集通常为分析报告最终需要展示的数据，可基于该数据在SQL、Python等分析单元中进行二次整合分析，也可将该数据作为图表、表格、地图、交叉表进行可视化展示的输入数据。

生成查询结果集。
您需先基于数据库或文件数据集进行查询分析，其分析结果将视为一个查询结果集。
说明
生成的查询结果集可在左侧数据集 > 查询结果集目录查看。
示例基于文件数据集进行查询分析，生成查询结果集，操作如下。
可按需更改查询结果集（序号3）的类型，支持的类型如下：
- 普通视图（View）：依赖该视图的查询都将直接从源表（即文件数据集或数据库的原始数据）中获取相应数据。
- 缓存视图（CachedView）：该视图会将相关数据缓存至Note本地，用于加速查询，减轻源表压力。
- Pandas的数据集（DataFrame）：支持在Python分析单元中使用Pandas操作数据。
基于查询结果集进行分析。
- 数据二次分析：可按需创建SQL、Python分析单元，执行相应分析代码。
  示例：使用SQL分析单元汇总result_1、result_2结果集的数据，并进行图表展示。

在数据集列表，可执行如下管理操作。不同类型的数据集支持执行的操作存在差异，具体请以实际界面为准。

按需拷贝表/文件名、基于所选数据集创建SQL查询、二次编辑文件数据、删除数据集。
重要
- 仅支持删除文件数据集，删除操作不可逆，请谨慎执行。
- 仅支持对.XLSX、.CSV类型的文件数据进行二次编辑，详情请参见二次编辑文件数据。
查看数据表详情。
- 结构：表的字段名称、数据类型等信息，不同表的参数字段存在差异。
- DDL：表的数据定义语言，仅供参考。仅数据库表支持显示该字段。
- 抽样数据：表的部分抽样数据，全量数据请在SQL分析单元中查看。