标签工厂是通过从标签创建到服务全链路的构建,为企业数据研发团队以及开发工程师提供一站式标签开发以及服务平台,适合多种场景(如风控、营销),提供离线、实时、服务标签的开发、管理、探索以及服务能力,赋能上层各端业务应用,为企业沉淀标签资产,使标签开发高效、好找、好用、好管理。
前提条件
已购买标签工厂增值服务并且当前租户已开通标签工厂模块。
使用限制
标签工厂支持的离线计算引擎有MaxCompute、CDH6.x Hadoop、CDH5.x Hadoop、FusionInsight 8.x Hadoop、TDH 6.x 、ArgoDB、Cloudera Data Platform 7.x。
离线计算引擎为CDH6.x Hadoop、CDH5.x Hadoop和TDH 6.x时,仅支持开源Flink实时计算引擎进行标签实时任务开发。
功能介绍
Dataphin标签工厂基于离线计算引擎、实时(流)计算引擎、数据服务的底层支持,包含标签开发、标签查找、群组圈选、服务应用等核心功能。
业务规划
实体创建:标签工厂遵循OLT模型进行实体建模,即实体(Object)、关系(Link)、标签(Tag)。您可在标签工厂创建业务实体并与ID(即从不同视角对实体进行的描述)进行绑定,实现实体和ID的映射关系。如用户编号、员工编号、用户邮箱等。
ID创建:用于定义实体关联的ID类型,如消费者、商家等实体关联的手机号、邮箱等。
标签开发
定义数据集:在进行标签开发前,您可通过数据源创建数据集定义,数据集允许您对数据源进行预加工。如定义数据集的数据范围、显示列等。
行为关系:通过具体的行为定义实体之间的关系,如用户购买商品通过购买这个行为描述了用户和商品这两个实体之间的关系,定义好的行为关系可以用于开发行为统计以及偏好类型的标签,或者直接用于圈选群组。
标签加工:标签是用来描述业务实体特征的一种数据形式。标签工厂支持创建离线、实时、服务、高级不同类型的标签。
群组圈选
对标签、行为关系、群组进行按条件分类,实现目标群体的精准定位和分析。如将年龄小于18岁的用户,划分为未成年用户群。
服务应用
资产市场:用于管理在工作台中开发好并上架到市场的标签以及群组。
资产应用:用于管理市场上申请的标签和群组以及创建的服务。
标签工厂入口
在Dataphin首页,单击顶部菜单栏标签。默认进入标签工厂的资产市场页面。