构建并使用DTS RAGFlow知识库

本文为您介绍如何使用数据传输服务DTS(Data Transmission Service)构建并使用RAGFlow知识库。

重要

此功能正在邀测中,仅部分用户可以使用。您可以通过功能交流钉钉群(群号:79690034672)或DTS数据准备功能试用申请表单,获取体验资格。

前提条件

  • 已创建向量数据库(二选一)。

    • 引擎版本7.0 标准版AnalyticDB PostgreSQL实例

      说明

      AnalyticDB PostgreSQL实例的内核版本需已升级7.2.1.2及以上,且已开启向量检索引擎优化

    • 数据引擎包含搜索引擎向量引擎的云原生多模数据库Lindorm实例

  • 已创建与向量数据库相同地域且存储类型标准存储的(存储冗余类型建议选择同城冗余存储(推荐)OSS Bucket

注意事项

  • 当前处于邀测阶段,仅部分用户支持在华东1(杭州)、华东2(上海)、华北2(北京)、华南1(深圳)、中国香港地域使用此功能。

  • 已开通外网地址的RAGFlow知识库,不支持关闭外网地址。

  • 注册的RAGFlow账户仅在相应的RAGFlow知识库中有效。

费用说明

详情请参见AI数据准备计费方式

操作步骤

创建RAGFlow知识库

  1. 进入目标地域的RAGFlow知识库列表页面。

    1. 登录数据传输服务DTS控制台

    2. 在左侧导航栏,单击数据准备

    3. 在页面左上角,选择数据准备实例所属地域。

    4. 单击RAGFlow 知识库页签。

  2. 单击创建知识库,进入任务配置页面。

  3. 配置RAGFlow知识库信息。

    1. 部署范围区域,填入RAGFlow知识库的实例名称

    2. 网络和可用区区域,依次选择RAGFlow知识库专有网络的VPC可用区和交换机备可用区及交换机

    3. RAGFlow知识库配置区域,填入RAGFlow知识库的知识库服务数量

      说明

      本示例的配置方案保持为默认

    4. 向量数据库配置区域,配置向量数据库。

      引擎为ADB PostgreSQL

      引擎选择为ADB PostgreSQL,然后在数据库选择目标AnalyticDB PostgreSQL实例,并填入该实例中接收数据的数据库名称数据库账号密码

      引擎为Lindorm

      引擎选择为Lindorm,然后在数据库选择目标Lindorm实例,并填入该实例中接收数据的数据库账号密码

    5. OSS配置区域,选择接收数据的Bucket,并填入存储数据的路径。

    参数说明

    参数

    说明

    付费类型

    仅支持按量付费

    地域

    RAGFlow知识库所属的地域。

    部署范围

    部署范围

    默认为RAGFlow知识库

    实例名称

    RAGFlow知识库的名称,建议配置具有业务意义的名称,便于后续识别。

    权限检测

    SLR角色授权

    需确保具有AnalyticDB PostgreSQL的服务关联角色AliyunServiceRoleForADBPG

    网络和可用区

    网络类型

    默认为专用网络

    VPC

    RAGFlow知识库所属的专有网络VPC。

    可用区和交换机

    RAGFlow知识库所属的主可用区和交换机。

    部署方案

    仅支持多可用区部署

    备可用区及交换机

    RAGFlow知识库所属的备可用区和交换机。

    说明

    备可用区不支持与主可用区相同。

    RAGFlow知识库配置

    配置方案

    DTS支持默认自定义两种方案。

    说明

    若您选择默认,则RAGFlow知识库配置只需再配置知识库服务数量知识库服务规格当前仅支持416G)。

    知识库基础服务规格

    RAGFlow知识库基础服务的规格,当前仅支持416G

    知识库基础服务数量

    RAGFlow知识库基础服务的数量,默认为4个。

    说明

    数量与RAGFlow知识库的费用相关。

    知识库数据准备服务规格

    RAGFlow知识库数据准备服务的规格,当前仅支持416G

    知识库数据准备服务数量

    RAGFlow知识库数据准备服务的数量,默认为2个。

    说明

    数量与RAGFlow知识库的费用相关。

    向量数据库配置

    向量数据库

    当前仅支持选择已有实例导入

    引擎

    接收数据的向量数据库类型。

    数据库

    接收数据的向量数据库实例。

    数据库名称

    AnalyticDB PostgreSQL实例中用于接收数据的数据库名称。

    说明

    仅当引擎ADB PostgreSQL时,才有此配置项。

    数据库schema名称

    AnalyticDB PostgreSQL实例的数据库中用于接收数据的Schema名称。

    说明
    • 仅当引擎ADB PostgreSQL时,才有此配置项。

    • 当前默认为public,且不支持修改。

    数据库账号

    向量数据库实例的数据库账号和账号密码。

    密码

    OSS配置

    OSS Bucket

    接收数据的Bucket。

    Path

    Bucket中存储数据的路径。

  4. 配置完成后,在页面右侧单击立即购买

  5. 返回至RAGFlow知识库列表页面,等待RAGFlow知识库正常运行(运行状态运行中)。

    说明

    您可以单击右上角的image以刷新任务列表,查看RAGFlow知识库的最新状态。

设置IP白名单

  1. 在目标RAGFlow知识库的操作列,单击设置白名单

  2. 根据访问RAGFlow的方式,在设置白名单面板中添加IP地址白名单。

    访问方式

    场景示例

    需添加的IP白名单

    说明

    内网

    客户端与RAGFlow知识库在同一专有网络。

    客户端的私网IPIP地址段。

    • 多个IPIP地址段以英文逗号(,)分隔。

    • 客户端的公网IP,可以通过curl ipinfo.io/ip(推荐)或curl ifconfig.me命令查询。

    外网

    客户端在您本地服务器。

    客户端的公网IPIP地址段。

  3. 单击设置

登录RAGFlow

  1. 在目标RAGFlow知识库的操作列,单击管理

    说明

    您也可以单击操作列的登录知识库,选择内网或外网进行登录。

  2. 连接地址区域,单击登录外网地址登录内网地址

    说明

    若您需要通过外网地址访问RAGFlow知识库,需为该实例开通外网地址

  3. 在登录页面,填入账户的邮箱和密码,并单击登录

  4. RAGFlow页面,进行管理知识库等操作。

    说明

    操作方法,请参见RAGFlow官方文档

    image

附录

开通外网地址

  1. 在目标RAGFlow知识库的操作列,单击管理

  2. 连接地址区域,单击开通外网地址

  3. 在弹出的开通外网地址提示框,单击确定

  4. 等待外网地址开通成功(基本信息区域的运行状态运行中)。

注册RAGFlow账户

  1. 进入目标RAGFlow知识库的RAGFlow登录页面

  2. RAGFlow登录页面,单击注册

    screenshot_2025-06-26_14-02-52

  3. 填入账户的邮箱、名称和密码。

    image

  4. 单击继续

    页面上方出现image提示,表示账户已注册成功。