根据阿里巴巴OneData方法论最佳实践,需求调研输出的文档中,主要包含业务需求的规范定义文档(派生指标、原子指标、业务限定、统计周期、统计粒度(即维度))。在进行模型设计前,建议先完成该部分工作,以便设计出易于业务使用的数据仓库。

指标定义注意事项

原子指标是明确的统计口径、计算逻辑。派生指标即常见的统计指标,派生指标=时间周期+业务限定+原子指标+统计粒度

真实操作过程中,DWD事实模型或DIM维度模型定义完成,才能创建原子指标。通常情况下,了解具体报表需求之后,即可进行派生指标的创建。在新建派生指标前,必须完成原子指标的创建,且需要确认原子指标的来源模型中有维度模型(关联,或者本身即维度模型),以保证可以设置派生指标的统计粒度。注意事项如下:
  • 原子指标和业务限定来源于同一张维度表或事实表,且继承来源表的数据域。
  • 统计粒度和时间周期必选,是否选择业务限定由具体的派生指标语义决定。例如,如果支付金额为原子指标,则最近七天买家支付金额(统计粒度为买家、时间周期为最近七天)和最近七天买家支付宝支付金额(统计粒度为买家、业务限定为支付宝支付、时间周期为最近七天)都可以作为派生指标。
  • 派生指标唯一归属于一个原子指标,且继承原子指标的数据域。

根据业务需求确定指标

本教程中,用户是A公司电商营销部门的营销数据分析师。数据需求为最近一天厨具类目的商品在各省的销售总额、该类目销售额Top10的商品名称、各省用户购买力分布(人均消费额)等,用于营销分析。

根据之前的分析,我们确认业务过程为确认收货(交易成功),需要用到对应事实模型中的度量——商品的销售金额。因此根据业务需求,我们可以定义出:
  • 原子指标:商品成功交易的金额的总和。
  • 派生指标为:
    • 最近一天全省厨具类目各商品的销售总额。
    • 最近一天全省厨具类目的人均消费额(消费总额除以人数)。

将最近一天全省厨具类目各商品的销售总额降序排序,取前10名的名称,即可得到该类目销售额Top10的商品名称。

创建指标

本节以原子指标为例,为您介绍如何基于Dataphin创建原子指标。

  1. 在Dataphin首页,单击顶部菜单栏的研发
  2. 选择开发 > 规范建模 > 原子指标
    原子指标页面
  3. 单击左侧功能区右上方的新建文件按钮,选择新建原子指标
    新建原子指标
  4. 在弹出的新建原子指标页面,选择数据域来源表
    选择来源信息
    说明 选择来源表之后,页面下方会展示该来源表下已有的原子指标列表
  5. 单击页面下方的新建原子指标
    原子指标列表
  6. 在弹出的新建原子指标对话框中,选择主要来源字段,填写英文名名称描述计算逻辑等,单击保存提交
    填写原子指标信息
  7. 提交成功后,即可在左侧功能区列表中找到上述步骤创建的原子指标。
    查找原子指标
说明 派生指标的创建方法请参见新建派生指标