RAG Agent

RAG Agent检索增强生成解决方案,旨在应对构建生产级RAG应用过程中所面临的数据接入、处理及检索流程的复杂性问题。通过与Supabase生态的深度集成,该解决方案能够自动化处理来自云存储的文档,并支持多模态解析、知识图谱构建等高级功能,从而使您能够高效地为应用赋予强大的基于知识库的问答能力。

功能简介

  • Supabase深度集成
    您可以在开通RDS Supabase项目时直接开启RAG功能,并通过Supabase可视化界面管理相关的表结构与数据。此外,它直接使用Supabase的鉴权体系(Auth),可以方便地管理不同用户对数据集的访问权限。

  • 自动化数据处理与嵌入
    提供一站式的数据处理能力。当您创建数据集并配置Supabase Storage作为存储时,RAG Agent会自动扫描并同步文件更新,并完成后续的智能分块(Chunking)、向量嵌入以及知识图谱构建等所有流程,极大简化了数据接入流程。

  • 多模态文档解析
    具备强大的文档解析能力,支持处理包含文本、图片、表格和公式的复杂多模态文档。系统采用专用的解析模型和智能分块策略,确保文档中的图片等元素在问答中被正确引用。解析后的中间文件(middle.json)也会保存在本地,方便您进行二次开发或调试。

  • GraphRAG与多模式查询
    支持构建知识图谱,以更加结构化的方式组织信息,从而提升检索的精准度与深度。在查询过程中,您可以灵活选择多种检索模式,包括向量搜索、图搜索或两者结合的混合搜索,以满足不同业务场景的需求。此外,系统还针对PostgreSQL进行了查询性能的优化。

核心功能

  • 数据集管理: 支持创建、查询、更新和删除数据集,并提供数据集的统计信息查询与健康检查。

  • 文档管理: 提供统一的文档上传接口,支持本地文件及Supabase、阿里云OSS等多种云存储。您可以对文档进行列表查询、删除、清空以及扫描更新等操作。

  • RAG查询: 支持在单个或多个数据集中执行查询,并提供流式响应。系统内置多种查询模式以满足不同场景的需求。

    查询模式

    适用场景

    响应速度

    准确性

    资源消耗

    naive

    向量检索。

    最快

    中等

    最低

    local

    基于局部上下文检索,适用于需要精确答案的具体问题。

    global

    基于全局知识图谱查询,适用于需要深度理解的概括性、概念性问题。

    中等

    中等

    hybrid

    结合局部和全局知识的混合检索,平衡准确性和覆盖面。

    中等

    中等

    mix

    结合向量与图搜索的混合模式,相当于naivehybrid的结合。

    中等

    bypass

    不经过RAG,直接由LLM(大语言模型)回答。

    依赖LLM

    中等

  • 知识图谱: 您可以获取数据集的图谱数据和标签,并通过前端界面进行交互式地可视化分析、搜索和导航。

  • 多模态处理:集成专业文档解析服务,结合先进的视觉模型(如通义千问VL、GPT-4 Vision等),支持处理包含文本、图片、表格及公式的复杂多模态文档,并兼容多种语言及光学字符识别(OCR)技术。

  • 缓存管理:数据集级别的精确缓存管理。

  • 流水线管理:实时获取数据集文档的处理状态,并支持通过前端监控。

  • 存储管理: 支持多种存储方案,您可以根据项目的实际需求(如成本、性能、部署环境)进行选择。

    存储类型

    适用场景

    配置复杂度

    性能特点

    成本

    扩展性

    本地存储

    开发测试、小规模部署

    读写速度快

    硬件成本

    有限

    Supabase

    企业级生产环境

    RDS PostgreSQL、阿里云OSS集成

    成本效益高

    极高

    阿里云OSS

    企业级生产环境

    高可用、全球加速

    按使用量计费

    极高

    Amazon S3接口兼容的对象存储

    大型企业、全球部署

    最成熟的对象存储

    多种计费模式

    极高

  • 数据隔离与安全: 基于PostgreSQL Schema为每个数据集提供独立的数据空间,从架构层面保证了企业级的数据隔离和安全。

  • 监控与诊断: 提供全面的系统健康检查接口、流水线状态监控以及完善的错误处理与反馈机制。

  • 前端界面:提供数据集管理、文档管理、查询检索、知识图谱可视化以及交互式API文档等功能界面,支持多语言及本地配置。

开通并使用RAG Agent

  1. 开通RDS Supabase项目时,开启RAG Agent

    RAG Agent内置了部分模型。当您使用需要通过公网访问的外部自定义模型时,必须为Agent启用公网NAT

  2. 开通成功后,在RDS Supabase列表中,单击目标项目访问地址列的设置白名单

  3. 在弹出的基本信息页的白名单信息区域,单击添加白名单分组,将目标客户端的IP地址添加到白名单中。

  4. 在浏览器中输入http://<Supabase外网连接地址>/rag,即可进入RAG Agent的登录页面。

    重要
    • Supabase外网连接地址应包含端口,例如输入http://8.147.XXX.XXX:80/rag

    • 如果您使用与RDS Supabase项目在同一VPC下的ECS进行登录,建议您使用内网连接地址

  5. 输入RDS Supabase项目的dashboard用户(默认为supabase)及其密码即可进行登录。