使用数据集和变量

更新时间:2025-03-28 02:36:04

DataV-Note(智能分析)的分析单元中,数据集将作为您进行查询分析的数据来源,变量则可用于构建联动查询,帮助您动态更新及筛选相关数据。本文为您介绍如何使用及管理数据集和变量。

使用须知

为确保相关操作能够顺利执行,在使用数据集和变量之前,请务必先了解以下内容。

  • 原始数据集:是用于进行查询分析的原始数据,包括数据库文件数据集

    • 数据库:其数据来源于数据库或数据仓库(例如,AnalyticDB MySQL、Hologres、MaxCompute)。使用前,需先在DataV-Note创建相应数据源

    • 文件数据集:其数据来源于本地的数据文件(例如,Excel)。使用前,需先将本地文件导入至DataV-Note,详情请参见添加文件数据

  • 查询结果集:是基于数据库、文件数据集等原始数据,通过指定条件筛选、处理生成的结果数据。该类数据可在SQL、Python等分析单元中进行二次分析,也可作为可视化分析单元(例如,图表)的输入数据。

  • 变量:是运行分析单元后输出的结果的集合(例如,SQL查询结果、过滤器生成的结果、控件输出的参数等),可供SQL、Python等引用,构建联动查询。

前提条件

进入项目编辑页面

  1. 登录DataV-Note控制台

  2. 所有项目 > 全部页签,鼠标悬停至目标项目,单击编辑,进入该项目的编辑页面。

    在该页面,您可使用原始数据集查询结果集进行查询分析,或使用变量构建联动查询。

使用原始数据集

使用原始数据集进行查询分析及可视化展示的通用步骤如下:

  1. 创建分析单元。

    数据集需在分析单元中使用,您可按需创建SQLPython智能分析等分析单元。

  2. 选择数据集进行查询分析。

    您可按需选择数据库文件数据集作为数据来源,并结合相关查询语句,进行分析及可视化展示。

    说明

    数据库、文件数据集的使用操作,请参见下文。

    示例使用SQL对数据集进行查询分析的步骤如下。image

    使用数据库

    数据集 > 数据库区域,将展示已成功连接的数据源(即数据源的连通性校验成功),您可基于该数据进行查询分析及可视化展示。

    说明
    • 全量数据源列表(包含连接成功、连接异常、未检测连通性等所有状态的数据源)请移至数据源管理目录查看。

    • 若当前没有合适的数据源,也可单击image图标,按照界面指引新建。

    示例:使用SQL分析单元查询Hologres数据源中nation表的数据。

    image

    使用文件数据集

    数据集 > 文件数据集目录,将为您展示已导入的本地文件数据,您可基于该数据进行查询分析及可视化展示。

    说明
    • 若无可用文件,可单击image图标,按照界面指引上传,详情请参见添加文件数据

    • 若上传的Excel文件包含多个Sheet,则编写的SQL查询代码需指明查询哪个Sheet的数据。

    示例:使用SQL分析单元查询Excel表的数据,并进行图表展示。

    image

使用查询结果集

查询结果集通常为分析报告最终需要展示的数据,可基于该数据在SQL、Python等分析单元中进行二次整合分析,也可将该数据作为图表、表格、地图、交叉表进行可视化展示的输入数据。

  1. 生成查询结果集。

    您需先基于数据库文件数据集进行查询分析,其分析结果将视为一个查询结果集。

    说明

    生成的查询结果集可在左侧数据集 > 查询结果集目录查看。

    示例基于文件数据集进行查询分析,生成查询结果集,操作如下。image

    可按需更改查询结果集(序号3)的类型,支持的类型如下:

    • 普通视图(View):依赖该视图的查询都将直接从源表(即文件数据集或数据库的原始数据)中获取相应数据。

    • 缓存视图(CachedView):该视图会将相关数据缓存至Note本地,用于加速查询,减轻源表压力。

    • Pandas的数据集(DataFrame):支持在Python分析单元中使用Pandas操作数据。

  2. 基于查询结果集进行分析。

    • 数据二次分析:可按需创建SQLPython分析单元,执行相应分析代码。

      示例:使用SQL分析单元汇总result_1、result_2结果集的数据,并进行图表展示。image

  • 可视化分析:可按需创建可视化分析单元,选择某个具体的查询结果集进行可视化展示。示例通过堆叠条形图展示retail查询结果集的数据。

    image

管理数据集

在数据集列表,可执行如下管理操作。不同类型的数据集支持执行的操作存在差异,具体请以实际界面为准。

  • 按需拷贝表/文件名、基于所选数据集创建SQL查询、二次编辑文件数据、删除数据集。

    重要
    • 仅支持删除文件数据集,删除操作不可逆,请谨慎执行。

    • 仅支持对.XLSX.CSV类型的文件数据进行二次编辑,详情请参见二次编辑文件数据

    image

  • 查看数据表详情。

    image

    • 结构:表的字段名称、数据类型等信息,不同表的参数字段存在差异。

    • DDL:表的数据定义语言,仅供参考。仅数据库表支持显示该字段。

    • 抽样数据:表的部分抽样数据,全量数据请在SQL分析单元中查看。

使用变量

在项目编辑页面左侧导航栏,单击image图标,进入变量页签。当前项目中所有分析单元的输出结果(例如,SQL查询、过滤器生成的查询结果集、控件输出的参数等)将作为变量呈现,可在SQL分析Python分析可视化分析中引用,构建联动查询。image

  • 本页导读 (1)
  • 使用须知
  • 前提条件
  • 进入项目编辑页面
  • 使用原始数据集
  • 使用数据库
  • 使用文件数据集
  • 使用查询结果集
  • 管理数据集
  • 使用变量
AI助理

点击开启售前

在线咨询服务

你好,我是AI助理

可以解答问题、推荐解决方案等