本文为您介绍如何新建工厂标签,包括新建基础指标、配置数据来源及标签值、物理化配置工程标签。帮助您完成行为偏好类的标签的创建。

新建基础指标

  1. 登录Dataphin控制台。
  2. 在Dataphin首页,单击顶部菜单栏的研发,进入研发页面。首页-萃取
  3. 单击萃取,进入数据萃取研发页面。萃取首页
  4. 单击标签中心 > 工厂标签进入工厂标签列表页面。Image 68
  5. 您可以通过以下任何一种方式,进入新建工厂标签页面:
    • 在数据萃取研发页面,单击页面右上角的新建,进入新建工厂标签页面。工厂标签新建--更多
    • 在数据萃取研发页面,单击项目名称后项目后,选择标签中心 > 工厂标签,进入新建工厂标签页面。工厂标签新建-项目
    • 在萃取首页,单击工厂标签下的新建域,进入新建工厂标签页面。
    • 在数据萃取研发页面,单击左侧导航栏下的工厂标签对象列表,进入萃取对象列表页页面。在工厂标签页面,单击页面右上角的新建标签,进入新建工厂标签页面。工厂标签新建-列表页
  6. 在新建工厂标签页面,根据页面提示完成参数配置,并单击确定新建工程标签
    说明
    • 标签名称是由汉字、字母、数字、下划线、-组合。但不支持纯数字格式。
    • 标签英文名是由数字、字母、下划线组合。但不支持纯数字格式。
    • 标签名称标签英文名结果表名不允许重复。

配置数据来源及标签值

  1. 新建标签页面,单击数据来源及标签配置下方的开始配置,进入数据来源配置页面。
  2. 根据页面提示完成参数的配置,并单击下一步
    • 按行为域筛选:选择来源数据所属的行为域,可多选。
    • 按动作对象筛选:按照行为域下具体的业务线选择动作对象,可多选。但所有数据集选择的对象数量总数不能超过10个。
    • 对象属性:如果已选行为数据有共有对象属性,还可以对共有对象属性设置筛选规则以进一步筛选需要的来源数据,最多选择3个共有对象属性。
    • 数据来源-时间跨度:Dataphin将基于所选时间跨度内的行为数据进行后续计算以生成最终标签。提供30天、60天、90天、180天、365天选项。
    数据来源配置-1
  3. 进入标签值配置页面,根据页面提示完成参数的配置,单击确定
    • 标签值-打标方式:包括直接打标和对象属性映射打标。
    • 标签值配置-标签值定义:根据标签值-打标方式配置标签值定义。
    Image 71
  4. 单击标签生成规则配置下方的开始配置,进入标签生成规则配置页面。根据页面提示完成参数配置,并单击确定
    • 返回标签值个数:定义每个ID最多能返回的标签值个数。每个ID可能对应多条行为数据,因此可能对应多个标签值,按照设置个数优先返回偏好度较大的标签值(标签值偏好度可在标签结果表查看)。
    • 选择衰减时间周期:不同时间的行为对标签值的影响程度不同。同一周期内行为的影响力相同,不同周期行为的影响力按照设置的衰减周期和曲线随时间递减。对于标签值会随着行为快速变化的,建议选择较短的时间周期(例如如纸尿裤型号偏好)。对于标签值相对稳定,不随行为快速变化的,建议选择较长的时间周期(例如预测个人肤质)。
    • 请选择衰减时间曲线:支持对所选数据来源-时间跨度(例如90天)行为数据,根据不同时间周期(如7天)切片(90/7=13个片段)设置衰减模式,不同时间周期行为数据标签值的影响力与您选择的衰减模式相关。例如,个人肤质是长期稳定的,因此一个消费者7天前收藏美妆商品的行为和最近7天收藏美妆商品的行为,对刻画这个消费者的护肤品功效偏好无影响,则选择衰减模式为平滑型。
    • 标签生成规则-行为权重分配:基于业务上的判断对多个行为进行权重分配,要求最多两位小数,且各项权重加和为 1。权重越大,表示该行为对最后标签值的影响越大。
    • 标签生成规则-覆盖用户范围:标签生成规则-覆盖用户范围。
    标签值配置

    完成以上操作步骤后即生成草稿态标签。

物理化配置工程标签

  1. 新建标签页面,单击物理化配置,进入物理化配置页面。
  2. 根据页面提示完成参数配置,并单击确认物理化配置
  3. 完成以上配置后单击页面右上方的,可完成钮保存当前配置。
  4. 单击页面右上方的,进行测试运行。必填信息配置完整后,提交前建议您先进行测试运行,以预览标签值分布及标签结果表数据抽样。测试运行分为4种状态:未测试运行、测试运行中、测试运行成功和测试运行失败。
    说明
    • 测试运行中时不允许编辑标签配置。如需修改,请先终止测试运行。终止测试运行后测试运行状态将更改为测试运行失败。
    • 如果您无需测试运行,也可以直接提交标签。
  5. 单击页面右上方的,进行提交工厂标签。
说明
  • 提交后需要对该标签进行补数据操作,以获取所选时间跨度内的历史行为数据作为来源数据。若您未进行补数据操作,则标签结果表数据可能为空。
  • 提交成功即发布到生产环境,生成周期任务参与调度。