数据湖构建(DLF)

本文介绍召回引擎版实例添加表选择数据湖构建(DLF)数据源的步骤详情。

前置条件

  • 了解数据湖构建

  • 已配置数据湖构建数据目录ID数据库数据表,将在配置数据同步中使用。

添加数据湖(DLF)数据源

  1. 实例详情>表管理页,点击添加表

  2. 填写表的基础信息,点击下一步image配置说明

  • 表名称:可自定义。

  • 数据分片数:表分片数不超过256的正整数即可(建议不超过实例数据节点数的3倍)。

  • 数据更新资源数:数据更新所用资源数,每个表默认免费提供2个4核8G的更新资源,超出免费额度的资源将产生费用,详情可参考召回引擎版计费概述

  1. 数据同步,配置数据源,校验通过后,点击下一步

    dlf数据校验.png

  • 全量数据来源:选择数据湖构建(DLF)。

  • 数据目录ID:访问的目标数据湖构建的数据目录ID。

  • 数据库:访问的目标数据目录下的数据库。

  • 数据表:访问的目标数据库下的数据表。

    说明
    • 存量实例选择数据湖构建(DLF)类型需升级实例离线版本后使用。

    • 当前仅支持Paimon类型数据目录。

    • Paimon主键表支持增删改查,Paimon Append格式表仅支持写入,不支持更改与删除。

  1. 索引结构配置,可选表单模式或开发者模式,配置完成后,点击下一步:

    召回引擎dlf索引结构cn.png

  2. 确认创建后,系统将自动创建配置好的表,可在变更历史中查看创建表进度,当表状态在使用中时,即可在查询测试页面进行查询测试。

注意事项

DLF的Paimon表有新数据写入时,OpenSearch会基于新数据自动触发实时索引构建,如果通过API手动写入数据,可能引起数据一致性问题,请谨慎操作。