本文为您介绍如何新建采集器,以采集PostgreSQL元数据至DataWorks。采集完成后,您可以在数据地图查看数据。

背景信息

使用元数据采集器全量采集元数据后,系统会开启自动增量采集,自动同步EMR表中新增的元数据至DataWorks。

操作步骤

  1. 进入数据发现页面。
  2. 在左侧导航栏,单击元数据采集 > PostgreSQL
  3. PostgreSQL元数据采集页面,单击新建采集器
  4. 新建采集器配置向导页面,完成以下操作。
    1. 基本信息页签下,配置各项参数。
      基本信息
      参数描述
      采集器名称采集器的名称,必填且唯一。
      采集器描述对采集器进行简单描述。
      工作空间采集对象(数据源)所属的DataWorks工作空间。
      数据源类型采集对象的类型,默认为PostgreSQL
    2. 单击下一步
    3. 选择采集对象页签下,选择相应的数据源
      如果没有您需要的数据源,请单击去新建,进入工作空间管理 > 数据源管理页面新建,详情请参见配置PostgreSQL数据源
    4. 单击测试采集连通性
    5. 待显示测试成功,单击下一步
    6. 配置执行计划页签下,配置各项参数。
      执行计划包括按需执行每月每周每天每小时
    7. 单击下一步
    8. 信息确认页签下,确认配置信息无误后,单击确认
  5. PostgreSQL元数据采集页面,单击相应采集器后的运行