本文为您介绍如何在数据地图模块开启元数据收集功能,并查看数据表信息。

前提条件

开始本实验前,请首先完成数据加工中的操作。

背景信息

元数据是数据的描述数据,可以为数据说明其属性(名称、大小、数据类型等),或结构(字段、类型、长度等),或其相关数据(位于何处、拥有者、产出任务、访问权限等)。DataWorks中元数据主要指库、表相关的信息,元数据管理对应的主要应用是数据地图

开启元数据收集

  1. 进入数据发现页面。
    1. 登录DataWorks控制台
    2. 在左侧导航栏,单击工作空间列表
    3. 选择工作空间所在地域后,单击相应工作空间后的进入数据开发
    4. 单击左上方的图标图标,选择全部产品 > 数据治理 > 数据地图
    5. 在顶部菜单栏,单击数据发现
  2. E-MapReduce元数据采集页面,单击新建采集器
  3. 新增采集器对话框中,选择引擎实例后,单击前往开启授权
    新建采集器
  4. 在E-MapReduce控制台中所选引擎实例的元数据页面,单击开启元数据收集
    开启元数据收集
  5. 确认开关变更对话框中,单击确定
  6. 成功开启元数据收集后,返回数据地图中的新增采集器对话框,单击刷新
  7. 授权状态刷新为已授权后,单击提交,即可开启元数据收集。
  8. E-MapReduce元数据采集页面,单击新建的采集器后的运行全量获取
    单击页面右上角的刷新,待EMR采集实例的运行状态显示为收集成功即可。
    说明 全量采集E-MapReduce元数据后,系统会开启自动增量采集,自动同步表中新增的元数据。

查看数据表信息

  1. 在当前页面的顶部菜单栏,单击全部数据
  2. 全部数据页面,单击E-MapReduce
  3. E-MapReduce页签下,单击表名(rpt_user_info_d),查看该表的详情。
    您也可以在顶部搜索框中输入关键字进行搜索,查看E-MapReduce表详情。
  4. 单击血缘信息,查看该表的上下游血缘详情。

后续步骤

现在,您已经学习了如何在数据地图模块开启元数据收集功能,并查看数据表信息。您可以继续下一个教程,学习如何对开发完成的任务设置数据质量监控,保证任务运行的质量。详情请参见配置数据质量监控