统计指标包括派生指标、原子指标、业务限定、业务过程和统计粒度(即维度)。在设计模型前,建议先完成该部分工作,以便设计出易于使用的数据仓库。
指标定义注意事项
原子指标是明确统计口径和计算逻辑,事实模型或维度模型定义完成,即可创建原子指标。派生指标即常见的统计指标,派生指标=统计周期+业务限定+原子指标+统计粒度
。
创建派生指标,注意事项如下:
- 已完成原子指标的创建,且需要确认原子指标的来源模型中有维度模型,以保证可以设置派生指标的统计粒度。
- 原子指标和业务限定来源于同一张维度表或事实表,且继承来源表的数据域。
- 统计粒度和时间周期必选,是否选择业务限定由具体的派生指标语义决定。例如,如果支付金额为原子指标,则最近7天买家支付金额(统计粒度为买家、时间周期为最近7天)和最近7天买家支付宝支付金额(统计粒度为买家、业务限定为支付宝支付、时间周期为最近7天)都可以作为派生指标。
- 派生指标唯一归属于一个原子指标,且继承原子指标的数据域。
确定指标
本教程中,用户是A公司电商营销部门的营销数据分析师。数据需求为最近一天厨具类目的商品在各省的销售总额、该类目销售额前10的商品名称、各省用户购买力分布(人均消费额)等,用于营销分析。
基于规范定义,确认业务过程为确认收货(交易成功),对应事实模型中的度量(商品的销售金额)。因此根据业务需求,我们可以定义出原子指标和派生指标:
- 原子指标:商品成功交易的金额的总和。
- 派生指标:
- 最近一天全省厨具类目各商品的销售总额。
- 最近一天全省厨具类目的人均消费额(消费总额除以人数)。
最近一天全省厨具类目各商品的销售总额降序排序,取前10名的名称,即可得到该类目销售额前10的商品名称。
创建指标
完成原子指标、派生指标、业务限定、维度和业务过程的创建,详情请参见规范建模。