原子指标是对指标统计口径、具体算法的抽象。Dataphin创新性地提出了设计即开发的理念,指标定义同时也明确了设计统计口径(即计算逻辑),提升了研发效率,并保证了统计结果的一致性。本文为您介绍如何创建原子指标。

操作步骤

  1. 登录Dataphin控制台
  2. 在Dataphin控制台页面,选择工作区地域后,单击进入Dataphin>>
  3. 在Dataphin首页,单击顶部菜单栏的研发
    默认进入数据开发页面。
  4. 在数据开发页面,按照下图操作指引,进入新建原子指标对话框。
    gagaga①区域选择规范建模研发的项目空间,如果您选择了Dev-Prod模式的项目空间,则需要在区域②选择为Dev
  5. 新建原子指标对话框,配置参数。
    gagag
    1. 配置基本信息区域参数。
      参数 描述
      业务实体 选择业务对象或业务活动。
      主题域 默认选中业务对象或业务活动所在的主题域。
      英文名称 命名规则如下:
      • 包含字母、数字或下划线(_)。
      • 不能超过64个字符。
      中文名称 命名规则如下:
      • 支持任何字符。
      • 不能超过128个字符。
      度量单位 选择原子指标的度量单位。包括货币单位时间单位比例单位名次对象量词其他
      数据类型 选择原子指标的数据类型。
      描述 填写对原子指标的简单描述。
    2. 配置计算逻辑区域参数,配置完成后单击确定
      您可以根据业务情况为原子指标选择数据时效并配置计算逻辑,数据时效包括天、小时和分钟。按照下图操作指引,进入添加计算逻辑对话框。gagaga
      参数 描述
      来源主表 选择来源表。为保证建模标准规范,来源表仅支持维度逻辑表或事实逻辑表。
      统计周期标识 只有周期快照事实逻辑表(df表)和维度逻辑表才有,事务型事实逻辑表(di表)是没有的(也可以理解为默认为ds分区字段)。统计周期标识是让您来指定某一个事件(业务过程)的发生时间字段。
      计算逻辑 是否可累加是指在相同统计粒度下指标(派生指标)相加是否有业务含义或符合业务规则。一般来说,去重计数的指标是不可累加的。

      例如,用户粒度下的成交金额累加是有业务含义的,张三的成交金额100,李四的成金金额200,即两人共成交 300;产品粒度下的购买人数累加在业务上就没有意义,A品牌手机的购买者100,B品牌手机的购买者50,这个150可能被放大了,因为有人可能同时买了两种产品,相加就将这个人多算了一次。

      聚合逻辑 编写定义原子指标的聚合逻辑。例如count(distinct order_id),其中order_id为来源逻辑表模型中的字段。您也可以单击参考示例,查看SQL编写示例。
    3. 配置完成后,按照下图操作指引,提交原子指标。
      gagaga
  6. 如果项目的模式为Dev-Prod,则您需要发布原子指标至生产环境。具体操作,请参见管理发布任务