DataWorks的全流程数据质量监控功能提供了35种预设表级别、字段级别和自定义监控模板,帮助用户第一时间感知源端数据变更与ETL全流程中产生的任何脏数据,并可自动拦截问题任务,有效阻断脏数据向下游的蔓延。

数据质量以数据集(DataSet)为监控对象,支持MaxCompute数据表和DataHub实时数据流的监控。当离线MaxCompute数据发生变化时,数据质量会对数据进行校验,并阻塞生产链路,以避免问题数据污染扩散。同时,数据质量提供历史校验结果的管理,以便您对数据质量进行分析和定级。

数据质量可以为您彻底根除下列问题:

  • 数据库频繁变更问题
  • 业务频繁变化问题
  • 数据定义问题
  • 业务系统的脏数据问题
  • 系统交互导致质量问题
  • 数据订正引发的问题
  • 数据仓库自身导致的质量问题