您可通过数据分层页面,配置数据分层检查器以规范分层中表名的命名要求,便于后期管理。本文将为您介绍如何通过数据建模控制台查看数据分层详情,以及创建数据分层检查器的操作方法。

前提条件

已创建待配置的数据分层,数据分层创建方法请参见创建数据分层

背景信息

数据分层检查器用于规范目标分层中表的命名,将同一分层中表名称的命名格式统一,便于您通过表名称,即可了解到该表所属的业务类型、作用功能、数据粒度等信息。同时,可以帮助您减少后期的运维成本。

系统默认创建的数据分层和您自定义新建的数据分层均可以配置数据分层检查器。

说明 您可重复执行如下步骤为不同的数据分层配置检查器。
  1. 数据分层页面,单击已创建的分层,进入该数据分层的详情页。
  2. 配置数据分层的检查器。
    在数据分层详情页,通过如下步骤配置检查器。
    说明 数据分层检查器用于规范目标分层中表的命名,将同一分层中表名称的命名格式统一,便于您通过表名称,即可了解到该表所属的业务类型、作用功能、数据粒度等信息。同时,可以帮助您减少后期的运维成本。
    1. 检查器区域,单击添加
    2. 配置检查器的参数信息。
      检查器
      参数 描述
      英文缩写 目标检查器的英文缩写。

      英文缩写由小写英文字母、数字、下划线(_)组成,并且以小写英文字母开头,不能以下划线(_)结尾,最大长度为128字符。

      名称 目标检查器的名称。

      检查器的名称由中文、大小写英文字母、数字、下划线(_)、&、英文括号、空格组成,并且由中文或大小写英文字母开头,不能以左括号、&、下划线(_)和空格结尾,最大长度为2048字符。

      类型 目前仅支持配置为表名检查器,用于检查挂载至目标分层中的表名称是否符合该数据分层的命名规范。
      表达式 用于检查表名称是否符合数据分层命名规范的正则表达式。

      例如,目标数据分层要求表名称以dim_开头,以_di_df结尾,则表达式为=^dim_.*_d[if]$

      如果表名称中需要使用动态匹配,则可以在表达式中使用系统占位符。例如:
      • 全量表的表名称需要配置为{数仓分层英文缩写}_{数据域缩写}{自定义表命名标签缩写}_d{f}
      • 增量表的表名称需要配置为{数仓分层英文缩写}_{数据域缩写}{自定义表命名标签缩写}_d{i}
      则表达式为=^${layerCode}_${dataDomainCode}.*_d[if]$
      目前DataWorks仅支持如下系统占位符:
      • ${dataDomainCode}:表所属数据域的英文缩写。
      • ${layerCode}:表所属数据分层的英文缩写。
      • ${businessProcessCode}:表所属业务过程的英文缩写。
      • ${businessCategoryCode}:表所属英文分类的业务过程。
      开关 表示配置的检查器是否生效。配置的检查器开关默认为打开状态,即默认检查器生效。
      实时检测 是否开启实时检测,默认关闭。
      • 实时检测开启时:在创建或修改表时,会对表名称自动实时检测,确保表名称是否符合命名规范。
      • 实时检测关闭时:在创建或修改表时,不会对表名称实时检测,您需要在创建或修改完成后,手动点击分层详情页中的触发检查,对表名称进行检测。
      备注 检查器的描述信息。
    3. 单击操作列的保存,保存后,检查器的配置才会生效。
    4. 启动检查器并查看检测结果。
      1. 检查器配置完成后,您可以单击触发检测,则系统默认启动该数据分层中的所有检查器,根据检查器的配置内容,检测分层中所有表的命名规范。
      2. 检查结束后,您可以单击查看结果,跳转至WebExcel页面查看本次检测结果。
      • 示例一:某公司希望目标数据分层中的表以dim_开头,则检测器中配置的表达式^dim_.*。当数据分层中包含命名为dim_skudim_storedimension_warehousefact_order的表时,触发检测后,检测结果如下表所示。
        表名称 是否符合数据分层的命名规范
        dim_sku 匹配
        dim_store 匹配
        dimension_warehouse 不匹配
        fact_order 不匹配
      • 示例二:某公司希望DWD数据分层中的表使用数据分层的英文缩写_表所在的数据域_自定义表命名标签缩写_df/di格式命名。当该数据分层中包含命名为dwd_sale_order_dfdwd_sale_order_didwd_sale_orderdws_sale_order_df的表时,触发检测后,检测结果如下表所示。
        表名称 是否符合数据分层的命名规范
        dwd_sale_order_df 匹配
        dwd_sale_order_di 匹配
        dwd_sale_order 不匹配
        dws_sale_order_df 不匹配

后续步骤

数据分层创建并配置完成后,您可继续进行数仓规划中的数据域、业务过程与业务分类的规划和创建。详情请参见数据域业务过程业务分类