数据经采集、集成、加工等流程处理完成后,可以在数据资产模块进行系统化管理。本文为您介绍数据资产全景的全局、流动和结构化模式。
前提条件
仅智能研发版支持使用资产全景功能。
资产全景介绍
资产全景页面仅用于展示生产环境中的元数据及加工所得的应用数据,包括以下三种模式:
全局模式
在Dataphin首页,单击顶部菜单栏的资产。默认进入目录页面。
按照下图操作指引,进入全局页面。
依次单击全景->全局。
在全局页面,右下角会展示各个业务板块的名称、数据量、占总数据量比,以及系统内的总数据表数、总项目数。
总数据量:分布式数据存储可能有多个副本(取决于计算引擎本身配置),当前展示的存储量为所有副本存储的总量。人工智能平台PAI模型训练绑定的MaxCompute项目的数据量、外部项目计算源的数据量不纳入计算。仅统计生产项目(包括prod和basic项目),T+1更新。
总数据表数:生产环境所有物理表和逻辑表总数,实时更新。
总项目数:生产项目数(包括prod和basic项目),实时更新。
将鼠标悬停旋转的球体上,可以查看某个业务板块的计算消耗、存储量和物理表数信息。
计算消耗:当计算设置为MaxCompute时,支持查看计算消耗信息,但是不包含Hologres的计算消耗。
存储量:仅统计生产项目(包括prod和basic项目),T+1更新。
物理表数:生产环境所有物理表总数,准实时更新。
流动模式
按照下图指引,进入流动页面。
在流动页面,为您可视化展示数据引入、物理表数和逻辑表数,为您提供数据输出后的数据查询及应用功能:
将鼠标悬停在数据引入模块上,为您展示的数据源个数、数据表接入量Top5和数据表接入量Least5。
数据源:统计昨天有数据同步到计算引擎的数据源数量,按照同步成功的表数量进行汇总排序,T+1更新。
数据表接入量Top5、数据表接入量Least5:基于同步任务和集成任务的实例数据进行汇总统计。
物理表数:生产环境所有物理表总数,准实时更新。
将鼠标悬停在逻辑表数模块上,会从数据架构和数据模型角度,为您展示各个指标的数量。
数据架构包含业务对象、业务活动、业务限定、原子指标、指标五种指标数量,其中,指标包括派生指标、衍生指标和自定义指标三类指标。
数据模型包含维度逻辑表、事实逻辑表、汇总逻辑表三种指标数量,而维度逻辑表数+事实逻辑表数+汇总逻辑表数之和,即是生产环境所有逻辑表的总数,准实时更新。
结构化模式
按照下图指引,进入结构页面。单击数据结构页面右上方的目标业务板块,系统将为您展示该业务板块的业务对象、业务过程及其关联关系。
业务对象:业务对象即参与业务的主体和客体,通常情况下业务对象是实际存在、不因事件发生而存在的实体。
业务过程:业务过程是业务活动中不可拆分的事件。
关系是指维度之间的关系:
具有父子关系的维度之间使用图标连接。
具有关联关系的维度之间使用图标连接。
在结构中心的可视化视图上,查看关联关系:
单击某个业务对象,则会高亮显示与之关联的实体及业务过程。
单击某个业务过程,则会高亮显示与之关联的维度。
您可以在搜索框中,输入业务对象或业务活动的名称进行搜索,同时您也可以单击搜索后的图标,在下拉列表中选择业务对象或业务活动,查看与之关联的对象。