逻辑结构说明

Dataphin业务模型的核心概念具有一定的逻辑结构,您可以通过了解其结构,为后期项目规划、建模等提供思路。本文为您介绍Dataphin中核心概念的逻辑结构及简要含义。

Dataphin核心概念的逻辑结构如下图所示。cege

由上图可见,Dataphin的架构包括以下几个层次:

  • 业务模型层和计算引擎层:业务模型层从业务视角对数据进行重新定义组织,分类打标;计算引擎层承载数据的实际计算与存储。

  • 业务模型层按照不同的业务形态,划分出业务板块,一种业务形态对应一个业务板块。

  • 同一种业务形态(业务板块)内,根据实际业务情况,将业务实体(维度和业务过程)划分到不同的数据域。

  • 基于维度和业务过程创建明细逻辑表(包括维度逻辑表和事实逻辑表),及定义指标(包括原子指标、业务限定、统计周期、统计粒度、统计时效、派生指标)。

说明

在Dataphin 3.3版本,维度更名为业务对象,业务过程更名为业务活动,数据域更名为主题域,业务板块更名为数据板块。

各层中核心概念的详细内容请参见下表。

核心概念

简要含义

数据板块

数据板块定义了数据仓库的多种命名空间,是一种系统级的概念对象。当数据的业务含义存在较大差异时,您可以创建不同的数据板块,让各成员独立管理不同的业务,后续数据仓库的建设将按照数据板块进行划分。

主题域

数据域即主题域,是对某个主题分析后确定的主题边界。例如,商品域、交易域、会员域等。

项目

项目是一种物理空间上的划分,便于用户在数据中台建设过程中对物理资源及开发人员进行隔离化管理。

业务实体

人们观察事物的角度,是指一种视角,是确定事物的多方位、多角度、多层次的条件和概念。

业务活动

业务过程即企业的业务活动事件,通常为不可拆分的事件,是一个或者多个业务对象在某个时间或时间段,为了达成某种目的所进行的活动或者是某种活动的结果。

维度逻辑表

丰富维度的属性信息形成的逻辑表。通过维度逻辑表可以设计及加工处理公共对象明细数据,以便提取业务中对象的明细数据。

事实逻辑表

用于描述业务过程的详细信息。通过创建事实逻辑表可以设计及加工处理公共事务明细数据,以便提取业务中事务的明细数据。

原子指标

对指标统计口径、具体算法的抽象。例如,支付金额。

业务限定

统计的业务范围,用于筛选出符合业务规则的记录(类似于SQL中Where后的条件,不包括时间区间)。

统计周期

定义派生指标的来源数据的时间跨度。例如最近1天、最近30天等(类似于SQL中Where后的时间条件)。

统计粒度

统计分析的对象或视角,用于圈定数据的统计范围,您也可以理解为聚合运算时的分组条件(类似于SQL中Group By的对象)。

统计时效

派生指标的计算频次,即派生指标产出的时间间隔。

派生指标

即基于原子指标、时间周期和维度,圈定业务统计范围并分析获取业务统计指标的数值。派生指标=原子指标+业务限定+统计周期+维度或维度的组合(统计粒度)

汇总逻辑表

派生指标归属的表就是汇总逻辑表。

物理表

计算引擎中的表,即通过DDL创建的表。

物化表

存储逻辑表真实数据的物理表。