原子指标是对指标统计口径、具体算法的抽象。Dataphin创新性地提出了设计即开发的理念,指标定义同时也明确了设计统计口径(即计算逻辑),提升了研发效率,并保证了统计结果的一致性。本文为您介绍如何创建原子指标。
前提条件
已完成业务实体的创建,具体操作请参见创建及管理业务实体。
操作步骤
- 在Dataphin首页,单击顶部菜单栏研发。默认进入数据开发页面。 
- 在顶部菜单栏中选择项目(Dev-Prod模式需要选择环境)。 
- 在左侧导航栏中选择规范建模 > 原子指标。 
- 在原子指标列表中单击  图标,选择新建原子指标。 图标,选择新建原子指标。
- 在新建原子指标对话框,配置参数。 - 配置基本信息区域参数。 - 参数 - 描述 - 业务实体 - 选择业务对象或业务活动。 - 主题域 - 默认选中业务对象或业务活动所在的主题域。 - 英文名称 - 输入英文名称时,Dataphin将根据输入数据实时匹配数据标准中已配置的词根,您可以选择推荐的词根作为业务实体的英文名称。更多信息,请参见创建及管理词根。  
- 英文名称需要满足以下命名规则: - 仅支持字母、数字或下划线(_)。 
- 不能超过64个字符。 
 
 - 中文名称 - 命名规则如下: - 支持任何字符。 
- 不超过128个字符。 
 - 度量单位 - 选择原子指标的度量单位。包括货币单位、时间单位、比例单位、名次、对象量词、重量单位和其他。 - 货币单位:分(人民币)、元(人民币)、万元(人民币)、百万元(人民币)、千万元(人民币)、亿元(人民币)、分(美元)、元(美元)、元(欧元)、元(港币)。 
- 时间单位:天、月、周、年、小时、分钟、秒、季度、毫秒。 
- 比例单位:小数、百分位数、千分位数。 
- 名次:排名(名次)。 
- 对象量词:户、笔、件、个、次、人日、家、手、张、包。 
- 重量单位:吨、公斤。 
- 其他:其他。 
 - 数据类型 - 选择原子指标的数据类型。包括string、bigint、double、datetime、timestamp、decimal、文本(varchar、char)、数值(int、smallint、tinyint、float)、日期时间(date)、其他(boolean、binary)。 - 指标口径 - 输入指标口径,即对指标的定义和加工逻辑等使用自然语言来描述,便于业务人员理解指标加工逻辑。例如: - 订单总量:即门店的有效订单总数,排除异常和未完结的订单。指标口径不超过1000个字符。- 描述 - 填写对原子指标的简单描述,不超过1000个字符。 
- 配置计算逻辑区域参数。 - 您可以根据业务情况为原子指标选择数据时效并配置计算逻辑,数据时效包括天、小时和分钟。 - 参数 - 描述 - 来源主表 - 选择来源表。为保证建模标准规范,来源表仅支持维度逻辑表或事实逻辑表。 - 统计周期标识 - 统计周期标识可指定某一个事件(业务过程)的发生时间字段。仅支持流程事实逻辑表(df表)和维度逻辑表,不支持事件事实逻辑表(di表)(也可以理解为默认为ds分区字段)。 - 计算逻辑 - 编写定义原子指标的计算逻辑。例如 - count(distinct order_id),其中- order_id为来源逻辑表模型中的字段。说明- 单击可应用列表中的字段,可将字段添加到计算逻辑编辑器中。 - 是否可累加 - 是否可累加是指在相同统计粒度下指标(派生指标)相加是否有业务含义或符合业务规则。一般来说,去重计数的指标是不可累加的。 - 例如,用户粒度下的成交金额累加是有业务含义的,张三的成交金额100,李四的成交金额200,即两人共成交 300;产品粒度下的购买人数累加在业务上就没有意义,A品牌手机的购买者100,B品牌手机的购买者50,这个150可能被放大了,因为有人可能同时买了两种产品,相加就将这个人多算了一次。 
- 配置完成后,单击保存并提交,提交原子指标。