RAGFlow概述与使用
RAGFlow是一款开源的企业级RAG(检索增强生成)引擎。AI原生数据库服务将RAGFlow集成到Agent开发平台中,帮助您快速构建基于私有知识库的RAG应用。
什么是RAGFlow
RAGFlow是一款基于深度文档理解的开源RAG引擎,能够对多种格式的非结构化文档进行智能解析、分块和向量化处理,为大语言模型(LLM)提供可靠的知识检索能力,从而减少模型幻觉、提升回答准确性。
AI原生数据库服务将RAGFlow集成到Agent开发平台的定制化开发模块中,提供一站式企业级RAG开发体验。您可以在AI原生数据库服务控制台中创建和管理RAGFlow实例,无需自行搭建和运维RAGFlow运行环境。
本文介绍的是Agent开发平台中RAGFlow作为开发工具的使用方式。如果您需要创建RAGFlow知识库实例(用于知识数据的存储和检索),请参见AI数据准备相关文档。
核心能力
RAGFlow提供以下核心能力:
能力 | 说明 |
深度文档解析 | 支持PDF、Word、Excel、PPT、Markdown、HTML等多种文档格式的智能解析,能够识别文档中的表格、图片、公式等复杂结构,确保知识提取的完整性和准确性。 |
智能分块 | 基于文档结构和语义理解进行智能分块,保留上下文关联信息,提升检索命中率和召回质量。 |
混合检索 | 结合向量检索与关键词检索,通过多路召回和重排序策略,提供更精准的知识检索结果。 |
问答与对话 | 内置对话引擎,支持基于知识库的多轮对话,可追溯答案来源,方便验证回答的可靠性。 |
平台集成优势
相比自行部署开源RAGFlow,在AI原生数据库服务中使用RAGFlow具有以下优势:
免运维部署:通过控制台一键创建RAGFlow实例,无需自行配置服务器、数据库和依赖环境,降低部署和运维成本。
数据就近访问:RAGFlow实例可直接访问AI原生数据库服务中已有的数据库实例,减少数据在多个系统间的流转。
与Dify无缝集成:RAGFlow实例可注册为Dify的外部知识库,在Dify应用中直接调用RAGFlow的知识检索能力,构建完整的RAG应用链路。
弹性资源管理:按需创建和释放RAGFlow实例,根据业务规模灵活调整资源配置。
使用流程
在Agent开发平台中使用RAGFlow的典型流程如下:
创建RAGFlow实例:在控制台中创建RAGFlow实例,系统将自动完成环境部署。
构建知识库:登录RAGFlow实例,上传业务文档并完成解析、分块和向量化处理,构建企业专属知识库。
开发RAG应用:基于已构建的知识库,配置检索策略和对话参数,开发知识问答或智能客服等RAG应用。
集成到Dify(可选):将RAGFlow知识库注册为Dify的外部知识库,在Dify应用中使用RAGFlow的检索能力。
访问方式
您可以通过以下路径访问RAGFlow:
登录AI原生数据库服务控制台。
在左侧导航栏,选择Agent开发平台 > 定制化开发。
在定制化开发页面,单击RAGFlow页签,即可进入RAGFlow管理界面。
在RAGFlow管理界面中,您可以创建实例、查看实例状态、登录实例进行知识库管理和应用开发等操作。
与Dify集成
RAGFlow支持通过标准API接口与Dify集成。您可以将RAGFlow中已构建的知识库注册为Dify的外部知识库,使Dify应用在对话过程中自动检索RAGFlow中的知识内容。
集成流程如下:
在RAGFlow实例中创建知识库并完成文档上传和解析。
获取RAGFlow实例的API地址和访问密钥。
在Dify中配置外部知识库连接,填入RAGFlow的API地址和密钥信息。
在Dify应用的知识库配置中选择已注册的RAGFlow外部知识库。