本文介绍如何在DataWorks中配置HDFS数据源。

操作步骤

  1. 登录DataWorks控制台
  2. 在左侧导航栏单击工作空间列表,单击目标工作空间操作列的进入数据集成
    进入数据集成
  3. 数据集成页面,单击左侧导航栏数据源 > 数据源列表
  4. 单击右上角的新增数据源
  5. 新增数据源页面,选择HDFS
  6. 新增HDFS数据源页面,按照页面提示进行参数配置。
    1
    参数 说明
    数据源类型 根据需要选择连接串模式CDH集群内置模式
    数据源名称 数据源名称必须包含字母、数字、下划线,但不能以数字和下划线开头。
    数据源描述 对数据源进行简单描述,不得超过80个字符。
    DefaultFS nameNode节点地址,格式为hdfs://ServerIP:Port
  7. 单击测试连通性
  8. 测试连通性通过后,单击完成

    测试连通性说明

    • 经典网络ECS上自建的数据源,建议使用数据集成自定义资源组,默认资源组不保证网络可通。
    • 专有网络目前不支持数据源连通性测试,直接单击完成