Dataphin使用流程

本文将指引您快速体验一次数仓建设基础流程。

进行数据开发与验证的基本流程如下:

主流程

说明

操作指导

准备工作

开通和配置Dataphin、设置Dataphin计算引擎、创建MaxCompute项目和准备数据源。

准备工作

规划数仓

基于本快速入门教程进行数仓规划配置,包括创建数据板块、计算源、数据源、项目及项目中的成员。

规划数仓

数据集成

同步源数据源中的数据至目标数据源。

引入数据

规范定义

基于Dataphin数据研发模块,明确统计指标口径并完成配置开发,相关的定义包括业务对象、业务活动、原子指标、业务限定和派生指标。

规范定义

规范建模

基于规范定义部分定义好的概念,基于Dataphin的规范建模功能圈定来源数据,并完成模型建设。

规范建模

开发环境补数据

在开发环境中对任务进行补数据以验证数据模型是否正确并符合预期,包括管道任务、维度逻辑表、事实逻辑表以及指标。

开发环境补数据

验证数据

您可以通过即席查询来验证数据正确性,验证通过后即可发布对应的任务或模型至生产环境。

验证数据

发布任务

发布开发环境的对象至生产环境,参与生产环境的运维调度。

发布任务

生产环境补数据

发布至生产环境的数据次日才会参与调度,本教程为了让您快速熟悉,采用补数据的方式,模拟生产环境调度任务生成实例。

生产环境补数据

查看运行结果

查看基于生产环境数据的任务运行结果是否符合预期。

查看运行结果

阿里云首页 智能数据构建与管理 Dataphin 相关技术圈