规范定义

规范定义是指以业务对象建模作为理论基础,构建总线矩阵,划分并定义数据域、业务活动、业务对象、原子指标、业务限定、时间周期和派生指标。本文为您介绍在本教程中如何进行规范定义。

实例数据说明

本示例以统计办公用品、技术产品两类产品各省份每天的销售总额为例,在company_sales_record_copy表中,选取如下字段进行分析。

字段

描述

order_id

表示订单号。

area

表示区域。

province

表示省份。

city

表示城市。

product_type

表示产品类型。

customer_name

表示客户名称。

report_date

表示订单日期。

order_amt

表示销售额。

基本概念

  • 业务对象

    业务对象是度量的基础,用来反映业务的一类属性,这类属性的集合构成一个业务对象 ,也可以称为一个实体对象。在划分数据域、构建总线矩阵时,需要结合对业务活动的分析定义业务对象。本教程中,以创建某年办公用品、技术产品两类产品各省份每天的销售总额指标为目标,故以province为业务对象进行数据建模。

  • 业务活动

    业务活动是指企业的业务活动事件,如下单、支付、退款都是业务活动。通常业务活动是企业活动中的事件,因此业务活动是一个不可拆分的行为事件。本教程中业务活动即下单购买,使用order_pay标识。

  • 原子指标

    基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标,具有明确业务含义的名词。原子指标=业务活动(动作)+度量,如支付(事件)金额(度量)。本教程中以order_amt为度量并对其进行汇总创建原子指标,则sum(order_amt)是原子指标。

  • 业务限定

    业务限定为统计的业务范围的圈定。为保障所有统计指标统一、标准、规范地构建,业务限定在业务板块内唯一,并唯一归属于一个来源逻辑表,计算逻辑也以该来源逻辑表模型的字段为基础进行定义。本教程中以product_type=‘技术产品’product_type=‘办公用品’为业务限定。

  • 派生指标

    派生指标=原子指标+业务限定+统计周期+业务对象(统计粒度)。派生指标即为对原子指标进行业务统计范围的圈定。本教程中派生指标为各省份办公用品、技术产品最近一天的销售总额,省份(province)为业务对象,下单购买产品为业务活动,销售总额为原子指标即sum(order_amt),产品类型限定为技术产品和办公用品为业务限定,统计周期为最近一天。

阿里云首页 智能数据建设与治理 Dataphin 相关技术圈