物理表详情入口
在Dataphin首页,单击顶部菜单栏的治理 > 资产清单。
单击数据表页签,选择目标物理表,单击物理表的名称或操作列下的图标,进入对象详情页面。
物理表详情
编号 | 描述 |
①概要信息 | 为您展示表的类型、环境、名称、标签、描述等信息。同时,您还可以执行如下操作: 搜索其他资产对象:您可以快捷搜索并切换查看其他资产的详情。 查看资产详情:如果当前对象已上架到资产目录,您可以快捷跳转至目录详情页查看已上架信息。 查看生产/开发对象:支持快速切换当前对象在对应生产/开发环境的对象详情。 标签:为您展示当前资产已配置的标签值。如需修改标签,您可以单击编辑: 收藏:单击即可收藏或取消收藏。收藏后,您可以在资产清单列表 > 我的足迹查看最近收藏的30条资产,方便后续查询;您也可以在个人数据中心查看全量收藏的资产,详情请参见查看及管理我收藏的资产。 去分析:单击跳转至Notebook页面自动创建对应的Notebook任务,详情请参见新建Notebook。 申请权限:单击快捷跳转到当前表的权限申请页面,详情请参见申请、续期和交还表权限。 反馈质量问题:您可以通过该功能向当前质量负责人反馈在使用资产过程中遇到的质量问题(如数据产出不稳定、数据内容不准确等),以通知相关负责人及时进行整改,从而推动提升资产可用性和健康度。配置详情请参见添加并管理问题清单。 您需要开通数据质量模块才能使用反馈质量问题功能。后续,您可以在质量模块的问题清单中查看反馈问题的处理流程和结果。 生成select语句:单击生成当前表查询语句,可选择是否需要添加转义符。您可以复制查询语句后到即席查询或分析页面查询数据。 查看DDL语句:单击查看当前数据表在租户计算引擎中对应的DDL语句。此外,您也可以选择数据源类型,单击生成DDL语句,系统将生成在指定类型的数据源系统中创建与当前表相同结构的表DDL语句。若您勾选了自动添加转义符,生成的DDL语句将根据选择的源类型自动添加对应的转义符,减少系统关键词误转义等问题产生。 编辑表:支持跳转至研发-表管理页面,编辑该表的DDL信息,详情请参见新建离线物理表。 导出字段:导出表中的字段信息,格式类型为CSV,便于其他开发或业务人员快速分析使用。 查看转交记录:为您展示当前数据表最近100条负责人转交记录。 查看权限列表:查看数据表权限信息。 刷新元数据:若数据表不是通过Dataphin平台创建,或由于系统元数据获取延迟导致查询新建表无结果时,您可以单击刷新元数据获取最新的元数据信息,将指定的数据表元数据刷新至Dataphin系统中。
说明 分析平台表不支持去分析、申请权限、反馈质量问题、编辑表、查看转交记录、查看权限列表操作。 |
②明细信息 | 为您展示表、字段和分区信息。 表详情:为您展示该表的属性信息,包括数据板块、主题域、项目、最高涉密等级、是否分区表、是否分析平台手工表、存储类型、存储格式、存储量、生命周期。 字段信息:包括字段名称、描述、数据类型、关联标准(需购买数据标准模块)、数据分类(需购买安全模块)、数据分级(需购买安全模块)、热度信息,同时,您可以单击操作列下的血缘关系图标,查看以指定字段为中心的字段血缘关系。 分区信息:可查看数据表的分区信息。多级分区将按照各级分区组合结果展示,不同分区之间用 / 连接。例如:ds=20221001/pt1=a/pt2=b。注意:分区记录数和存储量信息仅供参考。
|
③血缘&影响 | 血缘为您展示表、字段之间的血缘关系。 影响分为数据表影响和集成同步影响,为您展示引用了当前表的直接下游表,引用了直接下游表的间接下游表以及对应的集成同步任务,最多15层。支持导出数据查看。 勾选仅展示直接下游表后,默认展示当前表直接影响的下游表,取消勾选将展现所有下游影响表,最多展示15层。 勾选仅展示当前表影响后,默认展示当前表作为输入表的集成任务,取消勾选将展现当前及所有下游影响表作为输入表的集成任务,最多展示15层。
|
④质量概况 | 若您开通了数据质量功能,为您展示当前数据表的规则校验概览和质量监控规则列表,单击查看报告详情按钮或查看规则详情按钮,可快捷跳转到数据质量模块对应页面查看更多详情。 |
⑤数据探查 | 若您开通了数据质量功能,可以为数据表配置数据探查任务,快速了解数据概况,提前评估数据的可用性和潜在风险,如果您需要开启自动探查,可以在元数据中心 > 探查配置中开启相应配置,详情请参见新建数据探查任务。 |
⑥数据预览 | 若您拥有当前表的查表数据权限,可以使用数据预览功能,否则需先申请查询权限。如何申请,请参见申请、续期和交还表权限。 |
⑦产出信息 | 产出任务包含该对象的数据写入任务、血缘自动解析或自定义配置以当前表为输出表的任务,以及节点输出名称=项目名.表名的任务。 产出任务列表准实时更新,产出明细T+1更新。 |
⑧使用说明 | 您可以为数据表添加使用说明,为数据浏览者和消费者提供信息参考。可单击新增使用说明,填写使用说明标题及内容完成添加。 |
⑨资产信息 | 为您展示物理表的基础信息、变更信息和使用信息等详细信息。 |
表级血缘
表级血缘页面为您展示包括集成同步任务、自定义血缘的计算任务及系统可自动解析血缘的SQL计算任务和逻辑表任务血缘关系图。
序号 | 描述 |
①快捷操作区 | 仅展示直接血缘:选中后仅展示当前表直接血缘关系的上下游相关表。
说明 直接血缘是通过select、insert等语句读取或写入的上下游相关资产。 关联血缘是通过join、group by、where条件等方式引用的相关资产。 表级血缘只要包含有直接血缘的字段就会展示对应的标识。
隐藏数据源表:选中后将隐藏来自数据源的表对象及其下游。 隐藏已删除表:血缘在提交和发布任务时进行解析。特殊情况下,如果数据表不是通过Dataphin调度任务删除的(如通过即席查询删除或直接在引擎侧删除),则不会触发血缘更新,仍会展示在血缘图中。勾选后,将不会展示已经删除的表对象。
|
②图例区 | 表级血缘支持的数据表,包括物理表、维度逻辑表、事实逻辑表、汇总逻辑表、标签逻辑表、物理视图、物化视图、逻辑视图、元表、镜像表、数据源表。 |
③血缘图展示区 | 为您展示完整的血缘链路图,可手动展开多级上游或下游,支持根据数据表名称关键字进行模糊搜索。 特殊的,若存在循环依赖,则无法继续展开,需从起始节点继续查看下游。 |
④对象详情区 | 鼠标悬停在表上,为您展示表的详情。 数据源表:为您展示表的名称、对象类型、存储格式、所属数据源、血缘来源。 Dataphin数据表:为您展示表的名称、对象类型、存储格式、逻辑表及逻辑视图的所属板块/物理表及物理视图的所属项目、负责人、存储量、生命周期(Hadoop集群的计算引擎不支持展示该信息)、描述、血缘来源信息,同时您可以进行查看血缘、查看DDL和申请权限操作。 |
字段级血缘
字段血缘页面为您展示自定义血缘的计算任务及系统可自动解析血缘的SQL计算任务和逻辑表任务的血缘关系图。
序号 | 描述 |
①快捷操作区 | |
②图例区 | 字段血缘支持的字段,包括计算源表字段、数据源表字段。 |
③血缘图展示区 | 为您展示完整的血缘链路图,可手动展开多级上游或下游,支持根据字段名称关键字进行模糊搜索。 特殊的,若存在循环依赖,则无法继续展开,需从起始节点继续查看下游。 单击中心字段可通过字段关键字进行模糊搜索以切换查看不同字段的血缘关系图。 |
④对象详情区 | 鼠标悬停在字段上,为您展示字段的名称、对象类型、存储格式、字段所在逻辑表及逻辑视图的所属板块/字段所在物理表及物理视图的所属项目、所属表、表负责人、数据类型、描述、血缘来源信息,同时您可以进行查看血缘和申请权限操作。 |
产出明细
您可查看该数据表产出任务,包含该对象的数据写入任务、血缘解析或配置以当前表为输出表的任务,以及节点输出名称=项目名.表名的任务。
序号 | 描述 |
①任务详情 | 为您展示节点名称、任务ID、所属板块、负责人信息。 |
②周期实例 | 为您展示平均开始时间、平均产出时间、平均运行时长信息。 平均开始时间:统计最近15天所有正常调度的周期实例,第一次运行开始时间的平均值,T+1更新。 平均产出时间:统计最近15天所有正常调度的周期实例,第一次运行成功的结束时间的平均值,重跑场景不纳入统计,T+1更新。 平均运行时长:统计最近15天所有正常调度的周期实例,所有运行成功记录的平均运行时长的平均值,其中脚本任务的平均运行时长统计包括重跑场景,逻辑表任务的平均运行时长统计不包括重跑场景,T+1更新。
说明 小时、分钟实例支持按照周期查看运行明细,以当前任务最新调度配置划分的周期区间为准,计算定时时间相同的历史实例对应的运行平均值。
|
③运行明细 | 为您展示业务日期、状态、定时时间、开始时间、结束时间、运行时长信息。同时,您可以在操作列下进行查看实例、查看日志操作。 |
字段详情
为您展示当前字段所在数据表的表详情,详情请参见物理表详情。