标签逻辑表用于将单个实体ID下的多个标签,或将有关联的多个实体ID及其标签进行关联。您可以基于特定业务场景下的实体ID和标签创建标签逻辑表,同步标签逻辑表至业务数据库,后续引入至应用进行营销投放圈选或报表分析等。本文为您介绍如何创建、配置及提交标签逻辑表。

应用场景

标签逻辑表的典型应用场景说明如下。faga
  • 营销推送场景:同步标签逻辑表至业务数据库后,即可基于Quick Audience等应用进行营销数据分析及圈选投放。

    例如,某企业新推出一款高端美白系列护肤品,企业需要筛选出潜在顾客进行试用。假设已有顾客的年龄、价格偏好和护肤偏好的标签,您就可以将这些标签关联生成标签逻辑表。您可以基于Quick Audience平台对标签逻辑表进行圈选年龄在20~35岁之间、护肤偏好为美白、价格偏好为800~1500元的顾客群体。

  • 数据分析场景:同步标签逻辑表至业务数据库后,即可通过Quick BI等智能服务平台进行可视化数据分析。Quick BI更多信息,请参见通过仪表板分析数据

    例如,基于顾客的居住地和护肤偏好的标签生成标签逻辑表。同步标签逻辑表至业务数据库中,即可引入至Quick BI平台,分析并展示上海、深圳、广州和北京地域顾客的护肤偏好分布。

原理介绍

标签逻辑表用于将单个实体ID下多个标签进行关联,或将有关联的多个实体ID及其标签进行关联,关联后将实体ID字段、标签字段及时间分区字段写入至标签逻辑表。例如,基于某顾客ID已生成身高、地域和爱好的标签,将身高、地域和爱好标签关联后,生成对应的标签逻辑表,如下图所示。faga

相关概念

本文涉及到相关概念的解释如下表所示。
概念名称 相关概念说明
实体ID 实体ID是对实体从不同视角的描述信息,实体包括用户、商品、企业、位置等。

例如,用户的实体ID为会员ID和手机号码、商品的实体ID为商品ID和商品产地、企业的实体ID为国有企业和金融企业。

标签 标签用于刻画用户画像、描述商品、描述企业、描述位置等。

例如,文娱爱好消费者、美妆商品、金融企业、上海区域。

标签逻辑表 标签逻辑表用于将某实体下的多个标签进行关联。关联后将实体ID字段、标签字段和时间分区字段写入至标签逻辑表。

前提条件

标签逻辑表是基于实体ID和标签进行创建,因此在您开始创建标签逻辑前需要完成实体ID和标签的创建:

操作流程

操作流程 描述
步骤一:创建标签逻辑表 完成标签的基本参数的配置后,Dataphin自动为标签逻辑表生成ID字段、标签字段和分区字段。
步骤二:配置标签逻辑表 完成标签逻辑表的调度配置和存储生命周期的配置。
步骤三:提交标签逻辑表 提交至生产环境的标签逻辑表,即可参与生产环境的调度。

步骤一:创建标签逻辑表

  1. 请参见入口说明,进入数据萃取页面。
  2. 按照下图指引,进入新建标签逻辑表对话框。
    gagag
  3. 新建标签逻辑表对话框,配置参数后,单击保存1
    参数 是否为必填参数 描述
    标签逻辑表名称 标签逻辑表创建后,其名称无法修改。命名规则如下:
    • 只能包括汉字、字母、数字、下划线和短划线(-)。
    • 项目空间内唯一。
    • 长度为64字符以内。
    标签逻辑表英文名 标签逻辑表创建后,其英文名无法修改。命名规则如下:
    • 只能包括字母、数字、下划线和短划线(-)。
    • 项目空间内唯一。
    • 长度为64字符以内。
    Dataphin默认为标签逻辑表英文名前添加label_,以标识标签逻辑表。
    选择ID 选择此前已创建的实体ID。同时,Dataphin支持选择某实体下的多个实体ID。
    标签取值 Dataphin当前仅支持选择基于实体ID
    选择标签 基于已选择的实体ID,选择此前已创建并需要关联的标签:
    • 只选择了一个实体ID,则标签能选到基于这个ID创建的规则统计标签、注册上挂标签。
    • 选择多个实体ID,则标签能选到基于所选实体ID组成的复合主键关联的注册上挂标签。

      关于注册标签的更多信息,请参见创建注册上挂标签

    描述 填写对标签逻辑表的简单描述。
  4. 保存成功后,Dataphin自动进入标签逻辑表详情页面。在标签逻辑表详情页面,查看标签逻辑表的字段。
    标签逻辑表的字段包括ID字段(已选择实体ID)、标签字段(已选择的标签)和分区字段(ds),如下图所示。faga

步骤二:配置标签逻辑表

  1. 在标签逻辑表详情页面,单击页面上方的调度配置。在调度配置面板,配置参数。
    1. 配置基本信息区域的参数。
      gagag
      说明 Dataphin自动生成名称、节点ID和节点类型的参数,不支持修改。
      参数 描述
      负责人 支持转交负责人。如果任务运行过程中触发告警,且监控配置指定责任人为告警信息的接收对象,则Dataphin会及时通知到该任务的负责人,便于您及时处理异常。

      负责人其他的操作权限取决于负责人的角色。关于角色对应的操作权限的信息,请参见用户角色和权限

      描述 支持修改标签逻辑表已有的描述,也支持为标签逻辑表添加描述。
    2. 配置调度配置区域参数。
      faga
      参数 描述
      时间属性 选择任务在生产环境调度的时间属性。时间属性包括正常调度和空跑调度:
      • 正常调度:按照调度周期的时间配置调度,并正常执行,通常任务默认选中该项。
      • 空跑调度:按照调度周期的时间配置调度,但都是空跑执行,即一调度到该任务便直接返回成功,没有真正的执行任务。
      适用场景说明如下:
      • 正常调度:适用于任务需要正常调度以产出数据的场景。
      • 空跑调度:适用于任务有段时间不需要产出数据,但不能阻塞下游任务执行的场景。
      暂停调度 即可暂停该任务及该任务的下游任务的调度,一旦调度到该任务会直接返回失败,不会执行。通常用于某个任务暂时不用执行,但后面还会继续使用的场景。
      调度周期 调度周期可选择:,您可以根据业务需要,指定任务运行的具体时间点。调度周期说明如下:
      • 调度,即调度任务每天自动运行一次。新建周期任务时,默认的时间周期为每天0点运行一次。
      • 调度,即调度任务每周的特定几天,在特定时间点自动运行一次。
      • 调度,即调度任务在每月的特定几天,在特定时间点自动运行一次。
      说明 调度和调度中,如果您没有指定任务的运行日期,为保证下游实例正常运行,Dataphin会每天生成实例后直接设置为运行成功,而不会真正执行任何逻辑,也不会占用资源。
      优先级 优先级定义了同一时间待调度任务的优先级。默认选择为中等优先级。您可以根据业务需求修改任务调度的优先级。Dataphin支持的优先级包括最低优先级、低优先级、中等优先级、高优先级和最高优先级。
    3. 配置依赖关系区域的参数后,单击确定
      faga
      参数 描述
      上游依赖 您可以通过自动解析和手动添加两种方式,为标签逻辑表节点添加上游依赖的节点:
      • 单击自动解析,Dataphin根据标签逻辑表选择标签的类型,自动解析上游依赖节点的规则不同。说明如下:
        • 选择的标签为注册上挂标签,Dataphin根据注册上挂标签的来源表解析出物理表节点或汇总逻辑表节点为上游依赖的物理节点或逻辑表节点。
          注意 如果来源物理表的输出名称非项目名.表名样式,则Dataphin可能解析不出来,需要您手动添加该来源物理表为上游依赖节点。
        • 选择的标签为规则统计标签,自动解析出标签结果表节点为上游依赖的标签结果表节点。
      • 如果需要添加其他节点作为当前标签的上游节点,则需要手动添加上游依赖的物理节点。
        注意 Dataphin不支持手动添加逻辑表节点。

        单击新增上游依赖,在新建上游依赖对话框中,输入所依赖节点的输出名称的关键字进行搜索节点,搜索到后单击确定新增

      当前节点 当前节点为您展示标签逻辑表数据输出的物理节点。当前节点名称即标签逻辑表名称,标签逻辑表名称的格式为LD_distill.label_标签逻辑表英文名,不支持修改。关于标签逻辑表的结构、数据预览等信息,请参见数据表详情

      如果标签逻辑表已提交且被其他任务所依赖,则单击操作列下的图标,可以查看输出节点的下游节点。

  2. 标签逻辑表页面,单击页面上方的物理化配置。在物理化配置面板,配置标签逻辑表的存储生命周期后,单击确认
    gagaga
    参数 描述
    存储生命周期 存储生命周期用于定义标签逻辑表在Dataphin的生命周期。存储生命周期对所有的标签逻辑表生效,默认36000天。您可以自定义标签逻辑表存储的生命周期,Dataphin对存储生命周期没有最大限制。

    Dataphin支持超级管理员、项目管理员和开发者角色的用户设置标签逻辑表的存储生命周期。

    选择分区字段 Dataphin默认展示ds,不支持修改。

步骤三:提交标签逻辑表

  1. 在标签逻辑表详情页面,单击页面右上方的fagaga图标。
  2. 提交备注对话框,填写备注信息,单击确定并提交,即可将标签逻辑表提交至生产环境。

后续步骤

基于您的业务诉求,选择后续的操作步骤:
  • 在运维中心查看并运维标签逻辑表的萃取任务,保证任务的正常运行。具体操作,请参见萃取任务
  • 查询标签逻辑表的业务数据产出情况,如下图所示。如何查询业务数据,请参见查询并下载数据gagag
  • 通过逻辑表输入组件和业务数据库对应的输出组件构建同步任务,同步标签逻辑表至业务数据库。具体操作,请参见配置离线单条管道
  • 基于标签逻辑表进行二次数据分析,包括数据建模或代码任务的研发。具体操作,请参见创建并配置普通维度逻辑表创建资源