本文为您介绍如何使用数据传输服务DTS(Data Transmission Service)构建并使用RAGFlow知识库。
适用范围
-
已创建向量数据库:
支持的向量数据库
适用范围
AnalyticDB PostgreSQL版实例
PolarSearch集群
已开启PolarSearch功能的PolarDB MySQL版集群。
云原生多模数据库Lindorm实例
引擎类型需包含搜索引擎和向量引擎。
PolarDB PostgreSQL版集群
已安装PGVector(向量检索)插件。
-
已创建与向量数据库相同地域且存储类型为标准存储的(存储冗余类型建议选择同城冗余存储(推荐))OSS Bucket。
-
地域:仅支持在华东1(杭州)、华东2(上海)、华北2(北京)、华南1(深圳)、中国香港、新加坡、印度尼西亚(雅加达)地域使用此功能。
注意事项
-
已开通外网地址的RAGFlow知识库,不支持关闭外网地址。
-
注册的RAGFlow账户仅在相应的RAGFlow知识库中有效。
费用说明
详情请参见AI数据准备计费方式。
操作步骤
创建RAGFlow知识库
-
进入目标地域的RAGFlow知识库列表页面。
-
登录数据传输服务DTS控制台。
-
在左侧导航栏,单击数据准备。
-
在页面左上角,选择数据准备实例所属地域。
-
单击RAGFlow 知识库页签。
-
-
单击创建知识库,进入任务配置页面。
-
配置RAGFlow知识库信息。
-
在部署范围区域,填入RAGFlow知识库的实例名称。
-
在网络和可用区区域,依次选择RAGFlow知识库专有网络的VPC、可用区和交换机、备可用区及交换机。
-
在RAGFlow知识库配置区域,填入RAGFlow知识库的知识库服务数量。
说明本示例的配置方案保持为默认。
-
在向量数据库配置区域,配置向量数据库。
说明在通过已有实例导入时,需要填写相应实例中已存在的数据库名称、数据库schema名称及数据库账号。
引擎为ADB PostgreSQL
将引擎选择为ADB PostgreSQL,然后在数据库选择目标AnalyticDB PostgreSQL版实例,并填入该实例中接收数据的数据库名称、数据库schema名称、数据库账号和密码。
引擎为PolarSearch
将引擎选择为PolarSearch,然后在数据库选择已开启PolarSearch功能的PolarDB MySQL版集群,并填入该集群中接收数据的数据库账号和密码。
引擎为PolarDB PostgreSQL
将引擎选择为PolarDB PostgreSQL,然后在数据库选择目标PolarDB PostgreSQL版集群,并填入该实例中接收数据的数据库名称、数据库schema名称、数据库账号和密码。
引擎为Lindorm
将引擎选择为Lindorm,然后在数据库选择目标Lindorm实例,并填入该实例中接收数据的数据库账号和密码。
-
在OSS配置区域,选择接收数据的Bucket,并填入存储数据的路径。
-
-
配置完成后,在页面右侧单击立即购买。
-
返回至RAGFlow知识库列表页面,等待RAGFlow知识库正常运行(运行状态为运行中)。
说明您可以单击右上角的
以刷新任务列表,查看RAGFlow知识库的最新状态。
设置IP白名单
-
在目标RAGFlow知识库的操作列,单击设置白名单。
-
根据访问RAGFlow的方式,在设置白名单面板中添加IP地址白名单。
访问方式
场景示例
需添加的IP白名单
说明
内网
客户端与RAGFlow知识库在同一专有网络。
客户端的私网IP或IP地址段。
-
多个IP或IP地址段以英文逗号(,)分隔。
-
客户端的公网IP,可以通过
curl ipinfo.io/ip(推荐)或curl ifconfig.me命令查询。
外网
客户端在您本地服务器。
客户端的公网IP或IP地址段。
-
-
单击设置。
登录RAGFlow
-
在目标RAGFlow知识库的操作列,单击管理。
说明您也可以单击操作列的登录知识库,选择内网或外网进行登录。
-
在连接地址区域,单击登录外网地址或登录内网地址。
说明若您需要通过外网地址访问RAGFlow知识库,需为该实例开通外网地址。
-
在登录页面,填入账户的邮箱和密码,并单击登录。
-
在RAGFlow页面,进行管理知识库等操作。
说明操作方法,请参见RAGFlow官方文档。

(可选)网络配置
RAGFlow默认不具备访问外部网络的能力。如需在RAGFlow中添加模型供应商,您需要为RAGFlow所属向量数据库的VPC配置NAT网关,以便允许其访问外部模型。
-
通过私网连接(阿里云大模型服务平台百炼)
通过私网访问阿里云百炼平台可以提高数据传输的安全性及传输效率。您可以通过私网连接(PrivateLink)建立专有网络 VPC与阿里云大模型服务平台百炼之间的网络连接。详细操作请参见私网访问阿里云百炼模型或应用 API。
-
通过公网连接
通过为RAGFlow所属向量数据库的VPC配置NAT网关,使其允许访问外部模型。NAT网关相关信息,请参见公网 NAT 网关。
附录
开通外网地址
-
在目标RAGFlow知识库的操作列,单击管理。
-
在连接地址区域,单击开通外网地址。
-
在弹出的开通外网地址提示框,单击确定。
-
等待外网地址开通成功(基本信息区域的运行状态为运行中)。
注册RAGFlow账户
-
进入目标RAGFlow知识库的RAGFlow登录页面。
-
在RAGFlow登录页面,单击注册。

-
填入账户的邮箱、名称和密码。

-
单击继续。
页面上方出现
提示,表示账户已注册成功。