维度是维度建模的基础和灵魂。在维度建模中,将度量称为”事实“,将环境描述为”维度“。维度表包含了事实表中指定属性的相关详细信息,常用的维度如日期维度、城市维度等。本文为您介绍如何创建维度表。

前提条件

公共层主要完成公共数据的加工与整合,建立整体统一的维度表。应用层基于实际应用需求,获取公共层加工整合后的数据,面向具体业务建立业务层面的维度表,进行持续的个性化数据建设及改造。您可根据需求选择创建公共层或应用层维度表,不同数仓分层创建维度表的准备工作如下表。
数仓分层 准备事项 参考链接
公共层 已在公共层创建数仓分层。用于确定维度表所属的层级。 创建数仓分层
已创建数据域,用于确定维度表所统计的业务数据视角。 数据域
应用层 已在应用层创建数仓分层。用于确定维度表所属的层级。 创建数仓分层
已创建数据集市,用于确定维度表所统计的特定应用场景或产品的数据类别。 数据集市

背景信息

结合业务的数据域的规划,提取出各业务数据域中进行数据分析时可能存在的维度,并将维度及其属性通过维度表的方式存储下来。例如,在进行电商业务数据分析时,可用的维度及其属性有:订单维度(属性包括订单ID、订单创建时间、买家ID、卖家ID等)、用户维度(性别、出生日期等)、商品维度(包括商品ID、商品名称、商品上架时间)等,此时您就可以将这些维度和属性创建为订单维度表、用户维度表、商品维度表等,将维度属性记录作为维度表的字段。后续您可将这些维度表部署到数仓中,通过ETL将实际维度数据按照维度表定义的方式进行存储,方便业务人员在后续的数据分析时进行取用。

维度表如上图所示:
  • 创建维度表时:
    • 可以关联本维度表是用于分析哪个业务分类、哪个数据域,便于后续直接查看具体某一数据域或数据集市下,有哪些维度表。
    • 可以指定维度表后续在数据建模分析使用时,维度表的数据存储于数仓中的哪个数据分层,一般情况下维度表可存储于公共维度层(DIM层)。
  • 维度表创建后,您可以将维度的属性添加为维度表的字段,并对维度表进行关联和分区的设置,使用统一的数据标准来进行字段设置,保障全数据域中的维度数据的属性是一致的。
  • 维度表配置完成后:
    • 可物化至存储引擎,后续在计算引擎中使用维度表进行数据分析。
    • 在进行数据派生指标和汇总表的设计创建时,可直接关联使用维度表中的维度。

创建维度表

  1. 进入维度建模
    1. 登录DataWorks控制台
    2. 在左侧导航栏,单击工作空间列表
    3. 选择工作空间所在地域后,单击相应工作空间后的数据开发
    4. 单击左上方的图标图标,选择全部产品 > 数据建模 > 维度建模,进入维度建模页面。
  2. 创建维度表。
    1. 维度建模页面,鼠标悬停至加号图标,单击逻辑模型 > 创建维度表
    2. 配置维度表的基本信息。
      您可根据需求,选择维度表所挂载的层级、数据域、业务分类、数据集市等信息,选择后,后续可进入相应对象的列表查看所创建的维度表。创建维度表主要参数说明如下。
      参数项 描述
      存储策略 维度表基于什么策略(即存储数据的时间周期及数据量范围)存储数据。
      维度 维度表关联的维度,用于配置维度表分析数据的视角。
      说明 创建维度,详情请参见创建维度
      表名规则 通过已配置的检查器规范维度表的命名规则。选择检查器后,该维度表的表名需按照检查器定义的规则配置。
      说明 配置检查器,详情请参见配置及使用数仓分层检查器
      生命周期 维度表保留的时间周期。最大可保留36000天。
      表类型 根据实际情况,选择如下类型。
      • 普通维度表:普通的维度表,无其他需求可选择该类型。
      • 枚举维度表:可进行枚举的维度表,例如性别维度表。
      • 层级维度表:存在字段需要设置层级关系,支持指标做上卷和下钻使用。例如国家、省份、市县等。
  3. 配置完成后,单击保存,维度表创建成功。
    在维度建模左侧目录树相应的数据域或业务分类下,可查找并统一管理维度表。

后续步骤

维度表创建完成后,您仍需为表配置字段管理、关联关系、分区设置等内容,并将该表发布至对应环境,详情请参见发布与管理表