LogHubStream Reader插件基于Loghub SDK实时抽取您配置的LogHub topic数据,并支持合并和分裂Shard。合并或分裂Shard后,数据可能会增加,但保证不会丢失数据。

操作步骤

  1. 进入数据开发页面。
    1. 登录DataWorks控制台
    2. 在左侧导航栏,单击工作空间列表
    3. 选择工作空间所在地域后,单击相应工作空间后的进入数据开发
  2. 鼠标悬停至新建图标,单击数据集成 > 实时同步
    您也可以找到相应的业务流程,右键单击数据集成,选择新建 > 实时同步
  3. 新建节点对话框中,输入节点名称,并选择目标文件夹
    注意 节点名称必须是大小写字母、中文、数字、下划线(_)以及小数点(.),且不能超过128个字符。
  4. 单击提交
  5. 在实时同步节点的编辑页面,鼠标单击输入 > LogHub并拖拽至编辑面板。
  6. 单击LogHub节点,在节点配置对话框中,配置各项参数。
    LogHub
    参数 描述
    数据源 选择已经配置好的LogHub数据源,此处仅支持LogHub数据源。

    如果未配置数据源,请单击右侧的新建数据源,跳转至工作空间管理 > 数据源管理页面进行新建。详情请参见配置LogHub数据源

    Logstore 选择当前数据源下需要同步的Logstore。您可以单击右侧的数据预览进行确认。
    高级配置 您可以在此设置是否拆分Logstore中的数据。如果选择拆分,则需要设置拆分规则
    输出字段 选择需要同步的字段。
  7. 单击工具栏中的保存图标。