一键数据探查,打造高质量数据开发、分析流程

更新时间:
复制为 MD 格式

场景描述

在数据开发或分析前期,我们常常难以全面掌握数据质量和分布情况。如果仅依赖人工编写SQL或逐字段统计,不仅耗时低效,还容易遗漏空值、异常值、重复值等关键问题,进而影响数据准备和后续分析的准确性。

解决方案与功能

Dataphin数据探查功能,帮助用户一键生成数据表的质量报告,让数据检查变得简单高效。

  • 手动探查:通过简易配置,对目标表的空值率、唯一值、值分布等关键指标进行分析和可视化展示,全面检测数据健康。

  • 自动探查:支持自定义探查规则,系统自动定期检查数据质量,及时发现并预警数据问题。

  1. 治理 > 资产清单 > 对象详情 > 数据探查页签,单击发起手动探查,在新建手动数据探查对话框中,选择探查分区、探查字段及关键指标(如空值统计、字段分布、唯一值统计),配置探查范围后单击确定,系统将自动执行探查。

    image

  2. 数据探查任务运行结束后,您可查看不同字段数据类型生成的数据探查报告以及探查后字段的统计分布结果。

    image

  3. 您也可以进行自动探查配置,选择探查分区、自动探查频率、探查范围等信息,系统将按照配置自动运行数据探查任务,定期生成探查报告。

    image