您可以将已开发好的标签(例如无需额外加工的来源表字段、代码任务加工生成的物理表字段、规范建模加工的派生指标等)上挂至萃取标签中心进行统一管理。后续可以基于注册上挂标签和规则统计标签构建标签逻辑表并为向下游应用提供服务。本文为您介绍如何创建注册上挂标签。

应用场景

注册上挂标签适典型应用场景:
  • 统一管理标签场景:您可以直接将通过其他方式已开发好的标签(例如无需额外加工的来源表字段、代码任务加工生成的物理表字段、规范建模加工的派生指标等)上挂至萃取标签中心进行统一管理。
  • 二次加工场景:基于注册上挂标签可以生成规则统计标签标签逻辑表,以实现为下游应用提供服务。

    例如,Dataphin已有年龄和性别标签,您可以基于已有标签创建20岁以下的年轻女性的衍生标签。

原理介绍

注册上挂标签用于将Dataphin已有数据表(汇总逻辑表或物理表)与实体ID进行关联,并为数据表的某些字段添加标签。上挂标签创建完成后,仅生成实体ID、字段和标签的映射关系,映射关系的示例如下图所示。faga

相关概念

本文涉及到相关概念的解释如下表所示。
概念名称 相关概念说明
实体ID 实体ID是对实体从不同视角的描述信息,实体包括用户、商品、企业、位置等。

例如,用户的实体ID为会员ID和手机号码、商品的实体ID为商品ID和商品产地、企业的实体ID为国有企业和金融企业。

标签 标签用于刻画用户画像、描述商品、描述企业、描述位置等。

例如,文娱爱好消费者、美妆商品、金融企业、上海区域。

前提条件

  • 已完成标签类目的创建。如何创建标签类目,请参见创建并管理标签类目
  • 已完成注册上挂标签需要关联实体ID的创建。如何创建实体ID,请参见创建并管理实体ID
  • 已确认Dataphin中有您需要的汇总逻辑表和物理表。如何搜索物理表和汇总逻辑表,请参见搜索数据

步骤一:配置实体和来源表的关联逻辑

  1. 请参见入口说明,进入数据萃取页面。
  2. 按照下图指引,进入新建标签页面。
    gagag
  3. 新建标签页面,选择来源主表。
    aga
    参数 描述
    来源表类型 选择需要上挂的标签所属的来源表,您可以是物理表,也可以是汇总逻辑表。
    来源主表 根据来源表类型,选择类型下生产环境的汇总逻辑表或物理表。
  4. 配置关联逻辑。
    fagag
    参数 描述
    标签主键 选择此前您创建的实体ID,包括ID_type和ID_value:
    • ID type可选范围是实体ID。
    • ID value可选范围是来源表字段。
    注意
    • 如果已选中的来源主表已经有了注册上挂标签,则不支持修改关联逻辑。
    • 汇总逻辑表的关联逻辑及统计粒度,系统自动识别不支持修改。
    如果您选的实体ID存在重复值导致无法确定实体的唯一性,您可单击新增,增加多个实体ID进行关联,确保实体ID的唯一性。
    注意 如果您添加多个ID,将生成联合主键。提交后不可修改注册上挂标签的关联逻辑。
    时间分区 选择时间分区,仅支持选择ds。

步骤二:为汇总逻辑表或物理表的字段添加标签

  1. 新建标签页面的添加标签区域,按照下图指引,选择来源主表中需要添加标签的字段。
    gaga
    注意 关联主键字段不支持为其添加标签。
  2. 新增列表页签,配置参数。
    gagag
    参数 描述
    标签名称 标签名称的命名规则如下:
    • 支持任何字符。
    • 长度不能超过64个字符。
    标签英文名 注册上挂标签创建后,其英文名无法修改。命名规则如下:
    • 包含字母、数字、下划线(_)。
      说明 标签英文名将作为标签逻辑表的列名,字母默认存储为小写字母。
    • 长度不能超过64个字符。
    所属类目 选择此前已创建的标签类目。
    公开状态 即标签的状态,用于定义项目空间内成员是否具有查看该标签的权限。
    公开状态包括公开和隐藏:
    • 公开状态的标签:Data_distill项目空间内所有成员都可以查看。
    • 隐藏状态的标签:Data_distill项目空间内仅项目管理员和标签负责人可以查看。

    更多权限信息,请参见数据萃取权限列表

    您可以在历史已添加列表页签,查看该来源主表中已添加的标签。fagag

步骤三:提交标签至生产环境

在新建注册上挂标签页面,按照下图操作指引,提交注册上挂标签至生产环境。gagag

后续步骤

基于您的业务场景,选择后续操作步骤: