表创建成功后,您需为维度表、明细表、汇总表配置字段管理、关联关系、分区管理等配置,完成后将表进行发布。本文将为您介绍如何添加字段、配置字段属性、发布以及管理表。

说明
  • 您也可以通过FML语句创建字段、关联关系及分区,操作方法请参见使用FML语句配置并管理数据表
  • 本文中字段管理、关联关系、分区管理的配置方法均适用于维度表、明细表和汇总表,以下以表泛指这三类表。

字段管理:添加表字段

您可以通过快捷模式代码模式为表添加字段,其中:
  • 汇总表:快捷模式可以选择从指标导入从表导入
  • 维度表明细表:快捷模式仅支持从表导入,即在查找已有表下拉列表选择已创建的表进行导入。
  • 快捷模式从指标导入(仅汇总表适用)导入字段
    1. 单击快捷模式下,从指标导入后的快速导入
    2. 在弹出的窗口中,会为您展示当前已创建的派生指标,您可以在派生指标中选择需要添加至汇总表字段,完成后单击下面的导入
  • 快捷模式从表导入从表导入
    1. 单击快捷模式下,从表导入后的展开
      说明 该操作为汇总表的界面操作,维度表明细表直接在查找已有表下拉列表选择已创建的表进行导入即可。
    2. 在查找已有表的输入框中输入格式为“项目名称.表名称”的表,即可选择对应的表,并在已引用的表后选择导入表的全部字段或部分字段。
    3. 在弹出的窗口中,会为您展示所选表的字段,您可以选择需要添加至汇总表字段,完成后单击下面的导入
  • 代码模式
    代码模式为您提供编辑代码的操作方式,单击代码模式后,弹窗中会根据已配置的字段信息自动生成表字段管理代码语言,您可以在此基础上进行代码开发,进一步修改完善表字段管理,完成后单击下方的确定添加字段。代码模式

字段管理:设置表字段属性

说明 维度表、明细表、汇总表的字段属性不完全一致,修改设置的操作基本一致,以下以设置汇总表字段为例,为您示意操作步骤。
完成上述操作后,汇总表所需字段即已被添加至汇总表中,此时您可以根据业务需求设置汇总表各字段的统计粒度/指标冗余字段操作(设置字段关联其他表字段)。
  1. 设置字段的统计粒度/指标
    汇总表的各字段数值的统计类型可通过设置字段的关联类型来指定,包括统计粒度统计指标两种。
    • 统计粒度:指定汇总表字段需要整合的统计数值的维度。例如,商品维度、商家维度。
    • 统计指标:指定汇总表字段需要整合的统计数值的指标。例如,近7天盒马App支付下单的金额数。
    说明
    • 仅汇总表支持字段的统计粒度/指标
    • 从指标导入的字段默认关联类型统计指标类型,关联内容为对应的派生指标。
    • 从表导入的字段、代码模式添加的字段无默认关联类型,您可以手动设置字段的关联类型为哪种类型。
    如果您想设置或修改字段的关联类型,可以参考以下步骤进行修改。修改关联类型单击字段管理右侧的关联粒度/指标,在弹出的窗口中,修改字段关联的类型和关联的内容,完成后单击确定
  2. 设置字段的冗余字段(设置字段关联其他表字段)。

    在已添加字段的操作列,单击冗余字段,即可设置字段的关联字段。

    冗余字段
  3. 设置字段的其他属性。

    您可以在展示已添加字段的右上方单击字段显示设置,选择需要展示出来的字段属性,并根据需要进行修改。

  4. 完成设置后单击左上角的保存

发布表

维度表、明细表、汇总表,可直接发布物化至绑定的DataWorks引擎中,用于后续计算引擎进行数据分析时使用。当前支持将表直接发布物化至MaxCompute、Hologres、E-MapReduce、CDH、MySQL引擎。

您也可以直接将表内容导出,然后手动导入至引擎中进行使用。手动导出支持MaxCompute、Hologres、Hive引擎,导入导出方法请参见导入与导出表配置

  1. 发布模型。
    表创建完成后,您可单击表详情页上方的发布,在弹出的发布对话框中配置如下内容。发布设置
    参数 描述
    工作空间 可选择当前表需要物化发布到哪个工作空间。此处可选择在数仓规划期间已添加为数据研发工作空间的空间。
    说明
    • 如果您没有添加数据研发工作空间,此时默认物化发布到当前所在的工作空间,界面不显示此参数,您无需进行配置。
    • 添加数据研发工作空间的操作详情请参见建模空间
    生效环境 可选择发布致开发环境或生产环境。
    说明
    • 如果您使用的是简单模式的DataWorks工作空间,则仅支持发布表到生产环境。
    • 如果您使用的是标准模式的DataWorks工作空间,则支持发布表到生产环境或开发环境。当选择发布表到生产环境时,系统会自动将该表同步发布至开发环境。
    引擎类型 选择数据存储的引擎,目前可选如下几类。

    MaxComputeEMR(E-MapReduce)HOLO(Hologres)CDHMySQL

    发布模式
    • 增量发布:选择该模式,发布时仅会将目标汇总表此次变更的内容发布至对应引擎。
    • 删除重建:选择该模式,发布时会将对应引擎中之前已发布的该汇总表删除,删除后再重新创建此次发布的汇总表。
    说明 如果您的表是首次发布,则无论选择哪种模式,系统均会在对应的引擎中新增该表。
    引擎实例 根据需求将表物化至上方引擎类型中选择的数据存储的引擎。
    发布备注 描述本次发布的相关内容。
  2. 配置完成后单击发布,系统会将表发布至对应的开发环境或生产环境。
    说明
    • 发布时间约1分钟,当系统提示deploy plan execute success则表示发布成功。
    • 您可重复执行发布操作将表发布至不同的环境中。
  3. 可选:发布完成后,您可单击发布日志查看发布结果以及发布错误后的错误原因。

复制表

如果您已创建完成部分表,后续希望可以快速创建内容一致的表,可使用复制表来快速创建。您仅需找到待复制的表,右键后选择复制表即可,表参数配置与新建表参数配置一致。复制表

表管理

创建完成维度表、明细表、汇总表后,您可以在左侧的目录树双击表名称,查看对应表的详情,在顶部您可以进行表的修改表内容或关联关系,也可以查看发布日志、导出DDL。表管理
  • 单击编辑即可对当前表的基本信息和字段进行修改编辑,编辑完成后单击保存即可完成修改。
    说明 编辑修改表信息后,需发布物化至引擎,才能在后续开发过程中使用最新修改后的表。
  • 单击刷新可对当前变内容进行刷新,以获取最新的表信息。
  • 单击关联关系即可创建或修改当前表的关联关系。
  • 单击发布即可将表发布物化至引擎。
  • 单击日志即可查看表发布日志详情。
  • 单击导出DDL即可将表信息转化为对应引擎的建表DDL语句,便于复制或直接导出DDL语句文件。

后续步骤

表内容发布至目标引擎后,您可以进入DataWorks的数据开发页面,基于该汇总表进行相关的数据开发操作。数据开发的功能介绍,详情请参见数据开发界面功能介绍