您可以通过DataWorks的采集元数据功能,将表结构及血缘关系采集到数据地图中,清楚的查看表的内部结构及表间的关联关系。本文为您介绍如何新建CDH Hive采集器,采集CDH Hive元数据至DataWorks。采集完成后,您可以在数据地图查看相关数据。
前提条件
背景信息
使用限制
- DataWorks目前不支持跨地域采集数据,即DataWorks采集器所在的地域需要与元数据所在的地域相同。
- DataWorks目前仅支持使用公网访问元数据。
新建采集器
- 进入数据发现页面。
- 登录DataWorks控制台。
- 在左侧导航栏,单击工作空间列表。
- 选择工作空间所在地域后,单击相应工作空间后的进入数据开发。
- 单击左上方的
图标,选择 。
- 在顶部菜单栏,单击数据发现,进入数据发现页面。
- 新建采集器。
- 在左侧导航栏,单击 。
- 在CDH Hive元数据采集页面,单击新建采集器。
- 配置采集器。
管理采集器
您可以在CDH Hive元数据采集页面,对已创建的采集器进行查看、编辑、删除等管理操作。

序号 | 描述 |
---|---|
1 | 在该区域,您可以输入采集器名称,搜索目标采集器。
说明 搜索采集器支持模糊匹配,即输入关键词,即可显示名称中包含该关键词的所有采集器。
|
2 | 在该区域,您可以查看相应采集器的运行状态、运行计划、上次运行时间、上次消耗时间及平均运行耗时等信息。
同时,您还可以对目标采集器执行如下操作:
说明 仅当执行计划配置为按需执行时,采集器的操作列才会显示运行及停止操作,其他周期计划的任务不涉及该操作。
|