数据输入、合并、清洗加工、聚合和关联节点支持数据探查。本文为您介绍数据探查的操作。
入口
您可以通过图示的方式进入数据探查界面。
说明
合并、清洗加工、聚合和关联节点进入数据探查的方式同上。
预览设置
数据探查支持快速采样、随机采样和字段采样三种采样方式。
说明
预览设置默认折叠,抽样方式默认快速抽样。
参与预览计算的数据最多一千行,原数据不足一千行取全量数据,超过则抽样数据。
快速采样:取前1000行数据。
随机采样:随机取1000行数据。
字段采样:可选择数据表的任一字段,所选字段不同值至少抽样一条。
探查卡片操作
探查卡片包括表头、数据质量柱图和值分布柱图三部分。
表头表头信息有字段名、字段类型、去重值个数、排序、搜索和更多功能。
说明
字段名、字段类型的修改及更多功能仅支持清洗加工节点。
字段名修改:点击字段右边的图标,输入新字段名进行修改。
字段类型修改
去重值个数:即对应字段去重后值的个数。
排序:排序分为两类,按计数排序和按枚举值排序,默认为按计数排序降序。您可根据实际需求选择排序的种类并进行升序或降序排序。
搜索:您可以通过图示的方式,输入相应搜索的值进行搜索。
更多功能:包括值替换、类型切换(即字段类型的修改)、拆分字段、复制字段和删除字段,具体操作请参见清洗加工。
数据质量柱图,显示字段值的有效值和缺失值。
值分布柱图
两种展示模式:条形图(详情视图)和直方图(概览视图),其中直方图只在当原始去重值超过域值时才会展示。当原始去重值小于域值时,仅显示条形图。
概览和详情可切换。
探查卡片交互式分析
探查卡片具体值柱子被点击,柱子高亮,未被选中数据部分颜色变浅,数据质量柱图对应区域高亮,不对应变浅,下方明细数据被联动。
点击数据质量柱图的有效值区域,本卡片对应值高亮,下方明细数据被联动。
文档内容是否对您有帮助?