数据分析及报告制作

更新时间:2025-03-06 02:02:44

DataV-Note(智能分析)中,分析单元是进行数据分析及报告制作的主要工作区域,而数据集和变量则是分析单元用于进行分析的输入数据。本文为您介绍DataV-Note支持的分析单元类型,以及数据分析及报告制作的流程概述。

概念须知

  • 分析单元:是分析报告的编辑区域,可编写SQLPython进行查询分析、输入文字辅助描述、使用图表进行可视化展示等。不同分析单元的功能及适用场景存在差异,请按需选择。

  • 数据集:是分析单元执行查询分析的输入数据。包括如下类型:

    • 原始数据集:是用于进行查询分析的原始数据,包括数据库文件数据集

      • 数据库:其数据来源于数据库或数据仓库(例如,AnalyticDB MySQL、Hologres、MaxCompute)。使用前,需先在DataV-Note创建相应数据源

      • 文件数据集:其数据来源于本地的数据文件(例如,Excel)。使用前,需先将本地文件导入至DataV-Note,详情请参见添加文件数据

    • 查询结果集:是基于数据库、文件数据集等原始数据,通过指定条件筛选、处理生成的结果数据。该类数据可在SQL、Python等分析单元中进行二次分析,也可作为可视化分析单元(例如,图表)的输入数据。

  • 变量:是运行分析单元后输出的结果的集合(例如,SQL查询结果、过滤器生成的结果、控件输出的参数等),可供SQL、Python等引用,构建联动查询。

操作流程

image
  1. 数据准备。

    进行数据分析及报告制作前,您需先将您的数据库、数据仓库及本地文件数据接入DataV-Note,作为DataV-Note的原始数据集,供分析单元进行查询分析。详情请参见数据源管理

  2. 数据分析及报告制作。

    1. 数据预处理。

      您可按需创建SQLPython分析单元,选择所需的原始数据集进行数据清洗、筛选、转换等预处理操作。在分析单元中使用原始数据集的操作详情,请参见使用原始数据集

    2. 生成结果数据并构建联合查询。

      原始数据集经过SQL、Python预处理后,会生成多个结果数据集;且所有分析单元的输出结果(例如,SQL查询、过滤器生成的查询结果集、控件输出的参数等)将作为变量呈现。结果数据集和变量可在SQL分析、Python分析中构建联动查询,生成最终需要产出的数据。详情请参见使用数据集和变量

    3. 可视化展示。

      您可将最终的产出数据接入至可视化分析单元,通过图表、表格等形式展示,以便观察数据趋势或相关规律。

    在整个数据分析及报告制作过程中,您也可使用文本分析、智能分析、交互控件等分析单元进行辅助分析,帮助您添加相关描述信息、辅助编写代码、添加控件提升交互体验。

    说明

    一个分析报告往往需要创建多个或多种类型的分析单元,每个分析单元相互独立,可对不同数据进行查询分析及可视化展示。请根据业务需要创建合适的分析单元使用。

  3. 预览及发布。

    报告制作完成后,您可预览报告内容进行二次修正,或将报告发布后进行导出及分享给他人使用。详情请参见报告预览及发布

管理分析单元

分析单元创建完成后,您也可按需执行分析单元的测试运行、重命名、顺序调整、预览状态的显隐调整等管理操作,详情请参见管理分析单元

分析单元类型

DataV-Note支持多种类型的分析单元,不同分析单元的功能及适用场景如下。

分析单元类型

功能描述

适用场景

支持的输入数据类型

效果展示

分析单元类型

功能描述

适用场景

支持的输入数据类型

效果展示

智能分析

根据输入的自然语言匹配算法,一键分析数据,输出分析思路、分析过程及分析报告,大幅缩短数据分析时长,节省人力资源。

  • 希望快速一键生成完整的分析报告。

  • 适用于代码能力较弱的用户。可辅助输出分析思路、编写分析代码。

  • 原始数据集

  • 查询结果集

CEEE2971-CFDF-45F9-86BB-BBF8011A5A35

SQL分析

使用SQL代码,对数据库中的数据进行提取、过滤、聚合和分析。

适用于SQL代码能力较好的用户。

  • 原始数据集

  • 查询结果集

  • 变量

image

Python分析

使用Python编程语言及其丰富的数据分析库(例如,Pandas、NumPy等)对数据进行清洗、建模和可视化。

适用于Python代码能力较好的用户。

  • 原始数据集

  • 查询结果集

  • 变量

image

文本分析

通过自然语言或Markdown语法辅助编写分析报告的描述信息。

适用于编写报告中的大纲标题、概述信息、说明及备注信息等。

无需输入数据。

image

可视化:图表分析

通过柱状图、折线图、饼图等形式直观展示数据的趋势、分布和对比关系。

适用于需要直观展示数据趋势的场景。

  • 查询结果集

  • 变量

image

可视化:表格分析

通过行、列的形式展示数据,支持排序、筛选和条件格式等。

适用于需要详细查看数据的场景,便于您进行精确分析。

  • 查询结果集

  • 变量

image

可视化:地图分析

将地理空间数据与业务数据结合,在地图上展示位置、区域和路径等信息。

适用于地理位置相关的分析。

  • 查询结果集(地理类型)

  • 变量

image

可视化:交叉表分析

通过多维度数据的交叉组合,展示变量之间的关系和分布情况。

适用于分类数据的统计分析。

  • 查询结果集

  • 变量

image

交互控件

通过点击、拖拽、输入等方式动态调整分析参数,实时更新分析结果。例如,日期、单选框等控件。

适用于需要快速构建联动查询,提升交互体验的场景。

需按照相应控件所需的参数配置输入。

image

  • 本页导读 (1)
  • 概念须知
  • 操作流程
  • 管理分析单元
  • 分析单元类型