维度是人们观察事物的角度,是指一种视角,是确定事物的多方位、多角度、多层次的条件和概念。本文为您介绍如何新建维度。

背景信息

维度即进行数据统计的对象。通常情况下,维度是实际存在、不因事件发生而存在的实体,例如时间维度、地区维度、产品维度等。创建维度,即从顶层规范业务中实体(或称主数据)的存在性及唯一性。

操作步骤

  1. 登录Dataphin。
  2. 在Dataphin首页,单击顶部菜单栏的研发,或者通过研发工作台的快速入口,进入研发页面。进入研发页面
  3. 选择开发 > 规范建模 > 维度
    进入维度页面
  4. Basic模式下的Basic项目和Dev-Prod模式下的Dev项目可以直接新建维度。在开发环境新建完成并提交后,再执行发布操作,生产环境中对应的项目才会新增维度。您可以通过如下4种方式中的任何1种方式进入新建维度页面:
    • 单击项目名称右侧的新建按钮,选择规范定义 > 维度新建维度1
    • 单击左侧功能区右上方的新建文件按钮。
    • 单击左侧功能区下方的维度对象列表,切换至维度页签,然后单击页面右侧的新建维度新建维度3
    • 在右侧的操作指引图上,单击维度下方的新建按钮。新建维度4
  5. 新建维度页面,根据页面提示配置维度基本信息填写维度基本信息
    参数 说明
    维度英文名 填写维度英文名。维度英文名由字母、数字、下划线组合组成,且默认以dim_作为前缀。
    维度名称 填写维度名称。维度名称由汉字、字母、数字、下划线或-组合组成。
    维度描述 对维度简单的描述。
    数据域 选择该维度所属的数据域。如果您还没有创建该维度所属的数据域,请参见新建数据域创建数据域。
    说明 数据域的划分请参见划分数据域
  6. 配置维度逻辑信息
    维度逻辑信息用于定义维度对象范围和对象特征,确保维度真实且唯一性存在。Dataphin为您提供四种维度类型,以满足不同维度对象建设需求。维度逻辑信息
    参数 说明
    普通维度 需定义主键及维度主从关系。普通维度创建完成并已成功发布后自动生成对应的维度逻辑表。
    普通维度(层级) 需定义主键、来源逻辑及层级,支持使用多个维度进行分析,不同维度之间存在稳定的层级关系。维度创建完成并已成功发布后自动生成一组有层级关联关系的维度逻辑表。
    枚举维度 需定义主键,支持列举及标准化枚举值以标识枚举维度对象。
    虚拟维度 需定义主键,支持没有具体业务实体承载、没有可固化数据范围逻辑定义的维度对象,也可以规范化业务建模。
    • 如果您选择普通维度,根据页面提示完成参数配置。
      参数 说明
      主键英文名 填写维度的主键英文名。英文名由字母、数字或下划线组合组成。
      主键名称 填写维度的主键名称。主键名称由汉字、数字、字母、下划线或-组合组成。
      主键类型 选择主键类型。主键类型包括:STRINGBIGINTDOUBLEDATETIME
      主键计算逻辑 填写维度主键计算逻辑,代码中需限制时间分区条件,否则可能出现运维报错或数据错误:
      1. 单击主键计算逻辑后面的参考示例,可以查看SQL编写示例,例如。
        select province from dataphin_test where ds='${bizdate}'
      2. SQL编写完成后,单击主键计算逻辑后面的规范性校验,可以校验您编写的SQL是否符合规范。
      所属主维度 可选择,如果选择,同时请您在右侧下拉框中选择所属的主维度。
    • 如果您选择普通维度(层级)
      1. 主键&来源逻辑定义,根据页面提示完成参数配置,并单击下一步
        参数 说明
        主键英文名 填写维度主键英文名。英文名由字母、数字或下划线组合组成。
        主键名称 填写主键名称。维度名称由汉字、字母、数字、下划线或-组合组成。
        主键类型 选择主键类型。主键类型包括:STRINGBIGINTDOUBLEDATETIME
        主表表名 选择主表表名,即同步任务中的目标表。
        说明 建议您选择生产环境中的表。
      2. 层级定义,根据页面提示完成参数配置。
        参数 说明
        子层字段 选择层级字段中的子层字段。
        父层字段 选择层级字段中的父层字段。
        名称字段 选择名称所在字段。
        层级定义 填写层级的个数,支持最多9个层级。
        生成叶子维度 选择是否生成叶子维度。如果选择,系统会自动生成叶子维度,如果选择,您需定义叶子维度的生成逻辑。
        层级根节点定义 基于来源主表字段,设定根层级(即无父层级)的判断条件,例如is_parent='ture' ,其中 is_parent来源主表字段。
        时间分区逻辑 基于来源主表字段,设定数据更新及获取时间周期的判断条件,例如ds=${bizdate}
    • 如果您选择枚举维度,根据页面提示完成参数配置。
      设置枚举信息的左侧框中,填写枚举维度成员与对应成员的信息,并以英文逗号 “,” 隔开,例如。
      F,女 M,男
      右侧的codevalue,根据您在左侧填写的信息自动解析填充。
    • 如果您选择虚拟维度,根据页面提示完成参数配置。
      参数 说明
      主键英文名 填写维度主键英文名。英文名由字母、数字或下划线组合组成。
      主键名称 填写主键名称。维度名称由汉字、字母、数字、下划线或-组合组成。
      主键类型 选择主键类型。主键类型包括:STRINGBIGINTDOUBLEDATETIME
      说明 如果虚拟维度为维度逻辑表或事实逻辑表的关联维度,则新建派生指标可以使用虚拟维度,同时作为统计粒度的虚拟维度的值从被关联的字段中选取。
  7. 维度信息填写完成后,单击页面右上方的保存和提交新建的维度。提交维度
  8. 提交成功后,完成维度的新建。发布维度,请参见发布管理
    • 普通维度提交成功后,会自动生成对应的维度逻辑表。
    • 普通维度(层级)提交成功后,会自动生成一组具有层级关联关系的维度逻辑表。
    • 维度逻辑表详情请参见编辑模型信息和表信息