Dataphin标签支持将离线数据集输出指标直接定义成为标签。本文将指导您如何通过指标映射方式创建离线标签。
前提条件
通过指标映射创建离线标签前需创建对应的离线数据集。更多信息,请参见创建并配置离线数据集。
操作步骤
在Dataphin首页,在顶部菜单栏选择标签 > 工作台。
在顶部菜单栏选择项目。
在左侧导航栏选择标签加工 > 离线标签,在离线标签页面单击新增标签。
在新增离线标签对话框中单击指标映射,进入新建指标映射页面。
在新增指标映射页面中,配置离线标签的业务属性、技术属性与加工逻辑。
业务属性
参数
描述
实体-实体ID
根据业务需求选择所需要定义的实体及实体对应的实体ID。
标签类型
标签类型按照加工方式对标签进行分类。
属性标签:用于描述客观事实,是描述实体画像最基础常见的标签,如性别、姓名标签等。
统计标签:按照业务需求根据实体行为或基础属性统计的计算后生成,如最近7天购买金额标签等。
预测标签:根据算法模型对实体特征或行为进行预测,如预测用户常驻省份标签等。
组合标签:通过设置特定规则对标签进行组合加工后生成,如消费者分层标签等。
时效性
时效性描述标签随时间变化的更新频率,分为动态及静态标签。
静态标签:一般描述实体的固有特性,一般不随时间变化而变化,如性别、姓名等标签。
动态标签:需要随时间变化动态更新来保证标签有效性,如最近7天下单金额等标签。
负责人
选择该离线标签的开发负责人。
技术属性
标签更新方式:支持周期更新和手动更新方式。
周期更新:在一定时间的间隔内自动更新标签。
手动更新:通过手动操作方式更新标签。具体操作,请参见离线标签概述。
加工逻辑
参数
描述
数据集
选择您需加工的离线数据集。
实体ID字段
默认为离线数据集的主键,不可修改。
标签定义
选择您需定义标签的指标名称并填写对应的标签名称和标签code等信息,支持单个添加和批量添加。
单个添加:单击添加,填写相关信息。
指标名称:选择所需定义的数据列。
标签名称:仅支持中文、英文字母大小写、数字和下划线(_),64个字符以内。
标签code:标签全局的唯一标识。创建的服务中存在相同名称的标签时,可帮助您定位具体标签。仅支持小写英文字母、数字、下划线(_),必须以小写英文字母开头,长度不超过64个字符。
标签码表:若选择的来源字段列已经配置码表,将使用来源数据集中该字段配置的码表。
说明单击支持查看码表详情,包括码表名称、码表的代码值和代码名称。仅支持展示前50条代码值。
值类型:无需填写。系统将根据您的列名称类型,自动识别值类型。
版本号:仅支持英文字母大小写、数字、下划线(_)、短划线(-)和半角句号(.), 长度不超过64个字符。
标签描述:填写标签的简单描述,1000个字符以内。
批量添加:
单击加工逻辑区域的批量添加,在选择数据集指标对话框的指标列表中选择一个或多个指标,可在搜索框中根据指标名称和描述搜索未生成标签的目标指标。
说明指标列表仅展示未添加至标签定义列表的数据集指标,并显示当前指标是否已生成标签。可选中仅查看未生成标签的指标,并单击已选进行全选。
指标已生成标签,代表某个标签的已提交版本引用了该指标。
单击确定,已选择的指标将自动填充至标签定义列表中。
您可以单击对应指标操作列的图标来删除单个指标,或选中多个指标或全选后再单击批量删除进行指标删除。若所有指标均被删除,则仅保留一个默认行,默认行中版本号为V1,其他参数为空。
说明标签定义列表中的指标不可重复。当数据集中指标已被添加到当前标签定义列表时,则不可被再次选中。
字段自动填充时,指标名称将被填充至标签code列,无论标签code列是否已有值;若指标存在标签描述,则将其填充至标签名称和标签描述列,此时若标签名称和标签描述列已有值则不进行替换。
单击提交,即可完成离线标签的创建。
完成离线标签创建后若您需正常使用,您还需进行标签发布。发布后,项目内成员可用该标签进行二次加工或圈选群组。
在离线标签列表中单击目标标签操作栏图标发布标签。
在发布标签对话框中,选择已经提交的标签版本进行发布。
说明发布前,您可单击查看版本对比,查看各版本的信息与区别。帮助您在发布前进行校验与确认。
单击确定,即可完成离线标签的发布操作。
后续步骤
完成离线标签创建与发布后,您可将该标签上架到对应市场进行管理,并在后续标签开发时进行使用。更多信息,请参见管理标签。