DataHub是流式数据(Streaming Data)的处理平台,为您提供发布、订阅和分发流式数据的功能,让您可以轻松构建基于流式数据的分析和应用。

背景信息

Datahub Writer通过Datahub服务的Java SDK向DataHub写入数据,使用的日志服务Java SDK版本如下。
<dependency>
    <groupId>com.aliyun.datahub</groupId>
    <artifactId>aliyun-sdk-datahub</artifactId>
    <version>2.5.1</version>
</dependency>

操作步骤

  1. 登录DataWorks控制台,单击相应工作空间后的进入数据开发
  2. 鼠标悬停至新建,单击数据集成 > 实时同步
    您也可以找到相应的业务流程,右键单击数据集成,选择新建 > 实时同步
  3. 新建节点对话框中,输入节点名称,并选择目标文件夹,单击提交
    注意 节点名称的长度不能超过128个字符。
  4. 在实时同步节点的编辑页面,鼠标单击输出 > DataHub并拖拽至编辑面板,连线已配置好的输入或转换节点。
  5. 单击DataHub节点,填写节点配置对话框中的参数。
    DataHub输出
    参数 描述
    数据源 选择已经配置好的DataHub数据源,此处仅支持DataHub数据源。

    如果未配置数据源,请单击右侧的新建数据源,跳转至工作空间管理 > 数据源管理页面进行新建。

    Topic 选择当前数据源下需要同步的Topic。您可以单击右侧的数据预览进行确认。
    批量条数 支持批量同步的数量。
    字段映射 映射源端和目标端的字段,进行同步任务时,会根据字段的映射关系同步数据。
  6. 单击工具栏中的保存