数据探查

数据输入、合并、清洗加工、聚合和关联节点支持数据探查。本文为您介绍数据探查的操作。

入口

您可以通过图示的方式进入数据探查界面。

1探查
说明

合并、清洗加工、聚合和关联节点进入数据探查的方式同上。

预览设置

数据探查支持快速采样、随机采样和字段采样三种采样方式。1采样

说明
  1. 预览设置默认折叠,抽样方式默认快速抽样。

  2. 参与预览计算的数据最多一千行,原数据不足一千行取全量数据,超过则抽样数据。

  • 快速采样:取前1000行数据。

  • 随机采样:随机取1000行数据。

  • 字段采样:可选择数据表的任一字段,所选字段不同值至少抽样一条。

2采样

探查卡片操作

探查卡片包括表头、数据质量柱图和值分布柱图三部分1333

    • 表头2表头表头信息有字段名、字段类型、去重值个数、排序、搜索和更多功能。

说明

字段名、字段类型的修改及更多功能仅支持清洗加工节点。

  1. 字段名修改:点击字段右边的image图标,输入新字段名进行修改。字段3

  2. 字段类型修改1类

  3. 去重值个数:即对应字段去重后值的个数。

  4. 排序:排序分为两类,按计数排序和按枚举值排序,默认为按计数排序降序。您可根据实际需求选择排序的种类并进行升序或降序排序。2排序

  5. 搜索:您可以通过图示的方式,输入相应搜索的值进行搜索。1搜索

  6. 更多功能:包括值替换、类型切换(即字段类型的修改)、拆分字段、复制字段和删除字段,具体操作请参见清洗加工2更多

  • 数据质量柱图,显示字段值的有效值和缺失值。1zhuti

  • 值分布柱图

两种展示模式:条形图(详情视图)和直方图(概览视图),其中直方图只在当原始去重值超过域值时才会展示。当原始去重值小于域值时,仅显示条形图。1直

概览和详情可切换。

概览1

探查卡片交互式分析

  1. 探查卡片具体值柱子被点击,柱子高亮,未被选中数据部分颜色变浅,数据质量柱图对应区域高亮,不对应变浅,下方明细数据被联动。交互3

  2. 点击数据质量柱图的有效值区域,本卡片对应值高亮,下方明细数据被联动。交互2