本文为您介绍如何在数据地图模块开启元数据收集功能,并查看数据表信息。
前提条件
开始本实验前,请首先完成
数据加工中的操作。
背景信息
元数据是数据的描述数据,可以为数据说明其属性(名称、大小、数据类型等),或结构(字段、类型、长度等),或其相关数据(位于何处、拥有者、产出任务、访问权限等)。DataWorks中元数据主要指库、表相关的信息,元数据管理对应的主要应用是数据地图。
开启元数据收集
- 进入数据发现页面。
- 登录DataWorks控制台。
- 在左侧导航栏,单击工作空间列表。
- 选择工作空间所在地域后,单击相应工作空间后的进入数据开发。
- 单击左上方的
图标,选择。
- 在顶部菜单栏,单击数据发现。
- 在E-MapReduce元数据采集页面,单击新建采集器。
- 在新增采集器对话框中,选择引擎实例后,单击前往开启授权。
- 在E-MapReduce控制台中所选引擎实例的元数据页面,单击开启元数据收集。
- 在确认开关变更对话框中,单击确定。
- 成功开启元数据收集后,返回数据地图中的新增采集器对话框,单击刷新。
- 授权状态刷新为已授权后,单击提交,即可开启元数据收集。
- 在E-MapReduce元数据采集页面,单击新建的采集器后的运行全量获取。
单击页面右上角的
刷新,待EMR采集实例的
运行状态显示为
收集成功即可。
说明 全量采集E-MapReduce元数据后,系统会开启自动增量采集,自动同步表中新增的元数据。
查看数据表信息
- 在当前页面的顶部菜单栏,单击全部数据。
- 在全部数据页面,单击E-MapReduce。
- 在E-MapReduce页签下,单击表名(rpt_user_info_d),查看该表的详情。
您也可以在顶部搜索框中输入关键字进行搜索,查看E-MapReduce表详情。
- 单击血缘信息,查看该表的上下游血缘详情。
后续步骤
现在,您已经学习了如何在数据地图模块开启元数据收集功能,并查看数据表信息。您可以继续下一个教程,学习如何对开发完成的任务设置数据质量监控,保证任务运行的质量。详情请参见配置数据质量监控。
在文档使用中是否遇到以下问题
更多建议
匿名提交