原子指标是对指标统计口径、具体算法的抽象。Dataphin创新性地提出了设计即开发的理念,指标定义同时也明确了设计统计口径(即计算逻辑),提升了研发效率,并保证了统计结果的一致性。本文为您介绍如何创建原子指标。
操作步骤
在Dataphin首页,单击顶部菜单栏研发。默认进入数据开发页面。
按照下图操作指引,进入新建原子指标对话框。
在新建原子指标对话框,配置参数。
配置基本信息区域参数。
参数
描述
业务实体
选择业务对象或业务活动。
主题域
默认选中业务对象或业务活动所在的主题域。
英文名称
输入英文名称时,Dataphin将根据输入数据实时匹配数据标准中已配置的词根,您可以选择推荐的词根作为业务实体的英文名称。更多信息,请参见新建和管理词根。
英文名称需要满足以下命名规则:
仅支持字母、数字或下划线(_)。
不能超过64个字符。
中文名称
命名规则如下:
支持任何字符。
不能超过128个字符。
度量单位
选择原子指标的度量单位。包括货币单位、时间单位、比例单位、名次、对象量词、重量单位和其他。
货币单位:分(人民币)、元(人民币)、万元(人民币)、百万元(人民币)、千万元(人民币)、亿元(人民币)、分(美元)、元(美元)、元(欧元)、元(港币)。
时间单位:天、月、周、年、小时、分钟、秒、季度、毫秒。
比例单位:小数、百分位数、千分位数。
名次:排名(名次)。
对象量词:户、笔、件、个、次、人日、家、手、张、包。
重量单位:吨、公斤。
其他:其他。
数据类型
选择原子指标的数据类型。包括string、bigint、double、datetime、timestamp、decimal、文本(varchar、char)、数值(int、smallint、tinyint、float)、日期时间(date)、其他(boolean、binary)。
描述
填写对原子指标的简单描述,1000字符以内。
配置计算逻辑区域参数。
您可以根据业务情况为原子指标选择数据时效并配置计算逻辑,数据时效包括天、小时和分钟。
参数
描述
来源主表
选择来源表。为保证建模标准规范,来源表仅支持维度逻辑表或事实逻辑表。
统计周期标识
统计周期标识可指定某一个事件(业务过程)的发生时间字段。仅支持流程事实逻辑表(df表)和维度逻辑表,不支持事件事实逻辑表(di表)(也可以理解为默认为ds分区字段)。
计算逻辑
编写定义原子指标的计算逻辑。例如
count(distinct order_id)
,其中order_id
为来源逻辑表模型中的字段。说明单击可应用列表中的字段,可将字段添加到计算逻辑编辑器中。
是否可累加
是否可累加是指在相同统计粒度下指标(派生指标)相加是否有业务含义或符合业务规则。一般来说,去重计数的指标是不可累加的。
例如,用户粒度下的成交金额累加是有业务含义的,张三的成交金额100,李四的成交金额200,即两人共成交 300;产品粒度下的购买人数累加在业务上就没有意义,A品牌手机的购买者100,B品牌手机的购买者50,这个150可能被放大了,因为有人可能同时买了两种产品,相加就将这个人多算了一次。
配置完成后,单击保存并提交,提交原子指标。