创建原子指标

原子指标是对指标统计口径、具体算法的抽象。Dataphin创新性地提出了设计即开发的理念,指标定义同时也明确了设计统计口径(即计算逻辑),提升了研发效率,并保证了统计结果的一致性。本文为您介绍如何创建原子指标。

操作步骤

  1. 在Dataphin首页,单击顶部菜单栏研发。默认进入数据开发页面。

  2. 按照下图操作指引,进入新建原子指标对话框。

    image.png

  3. 新建原子指标对话框,配置参数。

    1. 配置基本信息区域参数。

      参数

      描述

      业务实体

      选择业务对象或业务活动。

      主题域

      默认选中业务对象或业务活动所在的主题域。

      英文名称

      • 输入英文名称时,Dataphin将根据输入数据实时匹配数据标准中已配置的词根,您可以选择推荐的词根作为业务实体的英文名称。更多信息,请参见新建和管理词根

        image.png

      • 英文名称需要满足以下命名规则:

        • 仅支持字母、数字或下划线(_)。

        • 不能超过64个字符。

      中文名称

      命名规则如下:

      • 支持任何字符。

      • 不能超过128个字符。

      度量单位

      选择原子指标的度量单位。包括货币单位时间单位比例单位名次对象量词重量单位其他

      • 货币单位:分(人民币)、元(人民币)、万元(人民币)、百万元(人民币)、千万元(人民币)、亿元(人民币)、分(美元)、元(美元)、元(欧元)、元(港币)。

      • 时间单位天、月、周、年、小时、分钟、秒、季度、毫秒。

      • 比例单位小数、百分位数、千分位数。

      • 名次:排名(名次)。

      • 对象量词:户、笔、件、个、次、人日、家、手、张、包。

      • 重量单位:吨、公斤。

      • 其他:其他。

      数据类型

      选择原子指标的数据类型。包括stringbigintdoubledatetimetimestampdecimal文本(varchar、char)数值int、smallint、tinyint、float)、日期时间(date)其他boolean、binary)。

      描述

      填写对原子指标的简单描述,1000字符以内。

    2. 配置计算逻辑区域参数。

      您可以根据业务情况为原子指标选择数据时效并配置计算逻辑,数据时效包括小时分钟

      参数

      描述

      来源主表

      选择来源表。为保证建模标准规范,来源表仅支持维度逻辑表或事实逻辑表。

      统计周期标识

      统计周期标识可指定某一个事件(业务过程)的发生时间字段。仅支持流程事实逻辑表(df表)和维度逻辑表,不支持事件事实逻辑表(di表)(也可以理解为默认为ds分区字段)。

      计算逻辑

      编写定义原子指标的计算逻辑。例如count(distinct order_id),其中order_id为来源逻辑表模型中的字段。

      说明

      单击可应用列表中的字段,可将字段添加到计算逻辑编辑器中。

      是否可累加

      是否可累加是指在相同统计粒度下指标(派生指标)相加是否有业务含义或符合业务规则。一般来说,去重计数的指标是不可累加的。

      例如,用户粒度下的成交金额累加是有业务含义的,张三的成交金额100,李四的成交金额200,即两人共成交 300;产品粒度下的购买人数累加在业务上就没有意义,A品牌手机的购买者100,B品牌手机的购买者50,这个150可能被放大了,因为有人可能同时买了两种产品,相加就将这个人多算了一次。

    3. 配置完成后,单击保存并提交,提交原子指标。

后续步骤

  • 如果项目的模式为Dev-Prod,则您需要发布原子指标至生产环境。具体操作,请参见管理发布任务

  • 完成原子指标创建后,您可根据创建的原子指标创建所需派生指标。具体操作,请参见创建派生指标