维度表用于确定您观察业务状况的视角,存储不同观察视角的维度描述。例如,分析产品销售情况,您可以选择按产品类别及时间两个维度进行分析,创建产品维度表及时间维度表。本文将为您介绍维度表的创建方法。

前提条件

  • 已创建数据分层。数据分层是将不同功能作用的表挂载至统一的数据层,方便您查找使用。维度表通常挂载于公共维度层(DIM层),您也可以根据业务需求,选择将维度表挂载至其他数据层。创建数据分层,详情请参见创建数据分层
  • 已创建数据域,用于确定维度表需要存储哪类业务类型的数据。创建数据域,详情请参见数据域

背景信息

结合业务的数据域的规划,提取出各业务数据域中进行数据分析时可能存在的维度,并将维度及其属性通过维度表的方式存储下来。例如,在进行电商业务数据分析时,可用的维度及其属性有:订单维度(属性包括订单ID、订单创建时间、买家ID、卖家ID等)、用户维度(性别、出生日期等)、商品维度(包括商品ID、商品名称、商品上架时间)等,此时您就可以将这些维度和属性创建为订单维度表、用户维度表、商品维度表等,将维度属性记录作为维度表的字段。后续您可将这些维度表部署到数仓中,通过ETL将实际维度数据按照维度表定义的方式进行存储,方便业务人员在后续的数据分析时进行取用。

维度表如上图所示:
  • 创建维度表时:
    • 可以关联本维度表是用于分析哪个业务分类、哪个数据域,便于后续直接查看具体某一业务分类或数据域下,有哪些维度表。
    • 可以指定维度表后续在数据建模分析使用时,维度表的数据存储于数仓中的哪个数据分层,一般情况下维度表可存储于公共维度层(DIM层)。
  • 维度表创建后,您可以将维度的属性添加为维度表的字段,且可以对维度表进行关联和分区的设置,并且可使用统一的数据标准来进行字段设置,保障全数据域中的维度数据的属性是一致的。
  • 维度表创建配置完成后,可发布物化至计算引擎,后续在计算引擎中使用维度表进行数据分析。
  • 维度表创建配置后,在进行数据派生指标和汇总表的设计创建时,可直接关联使用维度表中的维度。

创建维度表

  1. 进入数据建模
  2. 进入维度建模
    数据建模页面的顶部菜单栏,单击维度建模,进入维度建模页面。
  3. 创建维度表。
    维度建模页面,单击加号图标,选择创建维度表并配置如下信息。创建维度表
    参数项 描述
    数仓分层 选择已创建的数仓分层,后续使用此维度表时,维度表中的数据即存储在数仓的这一层中。创建数仓分层的操作详情请参见创建数据分层
    数据域 已创建完成的数据域,详情请参见数据域
    业务分类 已创建的业务分类,详情请参见业务分类
    存储策略 维度表存储数据的策略,可以选择每日增量每日全量等。
    表名规则 选择已配置的检查器。用于检测表名称是否符合该检查器制定的表命名规则。配置检查器,详情请参见配置数据分层检查器
    表名 表的内部名称,可由小写英文字母、下划线(_)、数字组成,并且以小写英文字母开头。
    表中文名 表的中文名称,可由中文、英文字母、下划线(_)、数字、and(&)、英文括号组成,并且以中文、英文字母或数字开头。
    生命周期 维度表存在的时间周期。
    表类型 根据实际情况,选择如下类型。
    • 普通维度表:普通的维度表,无其他需求可选择该类型。
    • 枚举维度表:可进行枚举的维度表,例如性别维度表。
    • 层级维度表:存在字段需要设置层级关系,支持指标做上卷和下钻使用。例如国家、省份、市县等。
    描述 维度表的描述信息。
  4. 配置完成后,单击保存,保存成功后,可在左侧目录树进行查看。

后续步骤

表创建完成后,您仍需为表配置字段管理、关联关系、分区设置等内容,并将表发布至对应环境,详情请参见配置发布表