通过可视化方式将标签计算结果做为标签值,本文将指导您如何通过规则创建计算标签。
前提条件
通过规则创建离线标签前需先创建对应的实体。更多信息,请参见创建及管理实体。
操作步骤
在Dataphin首页的顶部菜单栏中,选择标签 > 标签工作台。
在顶部菜单栏中选择项目。
在左侧导航栏中选择标签加工 > 离线标签。
在离线标签页面单击项目内标签页签,在项目内标签页签下,单击新增标签。
在新增离线标签对话框中,单击计算标签。
在新增计算标签配置步骤1中,配置基本信息的业务属性和技术属性。
业务属性
参数
说明
参数
说明
标签名称
填写标签名称。允许中文、英文、数字、下划线(_), 64个字符以内。
实体-实体ID
根据业务需求选择需要定义的实体-实体ID。
标签类型
标签类型按照加工方式对标签进行分类。
属性标签:用于描述客观事实,是描述实体画像最基础且常见的标签,如性别、姓名标签等。
统计标签:按照业务需求根据实体行为或基础属性统计计算后生成,如最近7天购买金额标签等。
预测标签:预测标签根据算法模型对实体特征或行为进行预测,如预测用户常驻省份标签等。
组合标签:通过设置特定规则对标签进行组合加工后生成,如消费者分层标签等。
计算标签:通过不同标签进行混合计算加工后生成,如毛利率、收入水平等。
时效性
时效性描述标签随时间变化的更新频率,分为动态和静态,默认选择动态。
静态:一般描述实体的固有特性,一般不随时间变化而变化,如性别、姓名等标签。
动态:需要随时间变化动态更新来保证标签有效性,如最近7天下单金额等标签。
负责人
选择标签所属负责人,默认选择当前用户。
标签描述
填写标签的简单描述信息,1000个字符以内。
技术属性
参数
说明
参数
说明
标签code
标签code是全局的唯一标识。例如,创建的服务中存在相同名称的标签时,可帮助您定位具体标签。必须以小写字母开头,允许小写英文字母、数字、下划线(_),64个字符以内。
标签更新方式
支持周期更新和手动更新。
周期更新:在一定时间的间隔内自动更新标签。
手动更新:通过手动操作方式更新标签。
单击下一步。
在新增计算标签页加工逻辑配置中,配置计算标签的加工逻辑信息。
参数
描述
参数
描述
版本号
填写您的标签版本号名称,默认
V1
。允许字母、数字、下划线(_)、短划线(-)、半角句号(.),64个字符以内。值类型
可选择字符串、长整型、双精度浮点型、日期、布尔、十进制小数。其中十进制小数默认为Decimal(38,18)。
码表
仅整型、布尔型和字符串型字段支持配置码表。
单击
进入配置码表对话框。
在配置码表对话框中,并配置相关参数。
配置码表:默认为不配置,可以选择码表为指标配置对应码表。
码表来源:目前仅支持手动配置。
码表名称:请输入码表名称。支持中文、英文、数字及特殊字符,128个字符以内。
码表描述:请输入码表的简单描述,1000个字符以内。
代码信息:支持单个输入和批量输入,最多支持500组。
单个输入:单击添加代码值,输入代码值和代码名称,均不得为空且必须唯一,此外,代码值的类型需要符合指标的值类型。可单击
删除当前行。
批量输入:单击批量输入,可以在批量输入代码信息对话框中,批量输入代码值及代码名称,每组按行分割,代码值和代码名称中间用半角冒号(:)分隔。单击点击识别后,系统将自动解析批量输入框的代码信息并填入代码信息列表。
一键清除:单击一键清除,系统将自动清除信息列表。
单击确定,完成代码值配置。
批量输入代码信息时,若存在重复的代码值或代码名称,单击确定后,系统将自动定位至第一个错误行。
标签配置
选择标签:单击选择标签,可在左侧标签列表中选择标签,并引用到表达式编辑区内。标签列表中支持全部标签、项目内标签和已申请标签,不可选择当前标签。可单击底部的标签市场,跳转至标签市场中查找或申请更多标签。
单击收起标签,收起左侧标签列表。
选择函数:单击选择函数,可在右侧函数列表中选择所需函数,并引用到表达式编辑区内。函数列表中仅包含当前租户计算引擎下的系统函数(单行函数),并按照分类展示,可按照函数名称进行搜索。单击函数后的
图标展示该函数的详细信息,包括函数名称、函数类型、命令格式和函数说明。单击函数名称后的
图标,可复制当前函数名称。
单击收起函数,收起右侧函数列表。
格式化:单击格式化,系统将自动规范当前表达式编辑区内的代码内容。
语法参考提示:
算术操作:支持加
+
、减-
、乘*
、除/
、英文括号()
逻辑操作:支持与
&&
、或||
、非!
、in
、not in
关系操作:支持大于
>
、小于<
、大于等于>=
、小于等于<=
、等于==
、不等于!=
条件表达式仅支持CASE WHEN,当使用CASE WHEN时,编辑区内仅允许填写符合CASE WHEN格式的内容。
支持引擎内建单行函数,如:
ROUND( @feature.total_liabilities / @feature.total_assets, 2 )
-- 算数运算 “ + 、减 -、乘 *、除 /、英文括号() ”-- -- 数值类标签:可使用上述所有算术运算符进行算术运算 FLOOR( ( @feature.resign_num + @feature.pre_resign_num ) / @feature.total_worker, 2 ) -- 逻辑操作:与 &&、或 ||、非 !、in、not in -- 关系操作:大于 >、小于 <、大于等于 >=、小于等于 <=、等于 ==、不等于 != -- 选择操作:CASE WHEN THE BETWEEN AND ELSE END -- 逻辑关系操作一般用作条件判断 -- 覆盖原有的圈选逻辑,以及分层标签逻辑,以及复杂指标的计算逻辑,但仅支持一层嵌套 CASE WHEN condition1 THEN value1 WHEN condition2 THEN value2 WHEN condition3 THEN value3 ELSE default_value END -- 指标分层标签 CASE WHEN @feature.salary < 3000 THEN 'Low' WHEN @feature.salary BETWEEN 3000 AND 5000 THEN 'Medium' WHEN @feature.salary > 5000 THEN 'High' ELSE 'Unknown' END -- 复杂计算税额 CASE WHEN @feature.salary < 36000 THEN 0 WHEN @feature.salary BETWEEN 36000 AND 100000 THEN @feature.salary*0.05 ELSE @feature.salary*0.1 END
语法校验:单击语法校验,系统将自动对当前表达式编辑区内的代码内容进行存在性和合法性的校验,校验规则如下:
存在性校验:校验标签和函数是否存在,若不存在系统将报错,您可根据报错内容检查填写内容。
合法性校验:校验是否存在非法字符以及是否能正确生成SQL,若存在非法字符或标签加工逻辑解析失败系统将报错,您可根据报错内容检查填写内容。
单击提交,即可完成离线标签的创建。
完成离线标签创建后若您需正常使用,您还需进行标签发布。发布后,项目内成员可用该标签进行二次加工或圈选群组。
在离线标签列表中单击操作栏
按钮发布标签。
在发布标签对话框中,选择您需发布的标签版本。
发布前,您可单击查看版本对比,查看各版本的信息与区别。帮助您在发布前进行校验与确认。
单击确定,即可完成离线标签的发布操作。
后续步骤
完成离线标签创建与发布后,您可将该标签上架到对应市场进行管理和为后续标签开发时进行使用。更多信息,请参见管理标签。
- 本页导读 (0)
- 前提条件
- 操作步骤
- 后续步骤