RAG应用流_人工智能平台 PAI(PAI)-阿里云帮助中心

大语言模型的知识缺少企业私有或实时的数据，通过检索增强生成RAG（Retrieval-Augmented Generation）技术可以检索私有知识库，并以上下文的方式提供给大语言模型，从而增强大语言模型回答的准确性和相关性。本文将详细介绍如何在LangStudio中开发和部署RAG应用。

背景信息

在现代信息检索领域，RAG模型结合了信息检索和生成式人工智能的优势，能够在特定应用场景中提供更为精准和相关的答案。例如在金融、医疗等专业领域，用户通常需要精确且相关的信息来支持决策。传统的生成模型虽然在自然语言理解和生成方面表现出色，但在专业知识的准确性上可能存在不足。RAG模型通过将检索与生成技术相结合，有效提升了回答的准确性和上下文相关性。本文以人工智能平台PAI为基础产品，为您介绍面向金融、医疗场景的大模型RAG检索增强解决方案。

前提条件

LangStudio向量数据库支持使用Faiss或Milvus向量数据库，若您希望使用Milvus数据库，您需要先完成Milvus数据库的创建，详情请参见创建Milvus实例、实例管理。
说明
Faiss通常用于测试环境，无需额外创建数据库即可使用。在生产环境中，建议您使用Milvus数据库，支持处理更大规模的数据。
已将RAG知识库语料上传至OSS中。本文针对金融、医疗场景提供以下示例语料：
- 金融新闻：数据为PDF格式，主要内容为公开新闻网站上的新闻报道。
- 疾病介绍：数据为CSV格式，主要内容为维基百科上的疾病介绍。

1. （可选）部署LLM和Embedding模型

RAG应用流需要用到LLM和Embedding模型服务，本节将详细介绍如何通过ModelGallery快速部署所需的模型服务。若您已有符合要求的模型服务，且服务支持OpenAI API，则可跳过此步骤，直接使用现有服务。

前往快速开始 > ModelGallery，分别部署以下两种场景的模型。更多部署详情，请参见模型部署及训练。

重要

请务必选择使用指令微调的大语言模型，Base模型无法正确遵循用户指令回答问题。

场景选择大语言模型，以DeepSeek-R1-Distill-Qwen-7B为例进行部署。
场景选择Embedding，以bge-m3 通用向量模型为例进行部署。

2. 创建连接

本文创建的LLM和Embedding模型服务连接基于快速开始 > Model Gallery中部署的模型服务（EAS服务）。更多其他类型的连接及详细说明，请参见服务连接配置。

2.1 创建LLM服务连接

进入LangStudio，选择工作空间后，在服务连接配置 > 模型服务页签下单击新建连接，创建通用LLM模型服务连接。

关键参数说明：

参数	说明

参数	说明
模型名称	当通过Model Gallery进行模型部署时，可通过模型详情页（在Model Gallery页单击模型卡片）查看模型名称的获取方法，详情请参见创建连接-模型服务。
EAS服务	PAI-EAS模型服务：本文使用PAI-EAS模型服务。此时EAS服务可选择1. （可选）部署LLM和Embedding模型中部署的LLM服务。选择之后，base_url和api_key会自动填充，分别对应已部署LLM的VPC访问地址和Token。第三方模型服务：使用第三方模型服务，例如当第三方为DeepSeek官方服务时，base_url为`https://api.deepseek.com`，api_key可从DeepSeek 官网获取。

2.2 创建Embedding模型服务连接

同2.1 创建LLM服务连接类似，创建通用Embedding模型服务连接。

2.3 创建向量数据库连接

在服务连接配置 > 数据库页签下单击新建连接，创建Milvus数据库连接。

关键参数说明：

参数	说明

参数	说明
uri	Milvus实例的访问地址，格式为`http://<Milvus内网访问地址>`。例如`http://c-b1c5222fba****-internal.milvus.aliyuncs.com`。
token	登录Milvus实例的用户名和密码，即`<yourUsername>:<yourPassword>`。
database	数据库名称，本文使用默认数据库`default`。

3. 创建知识库索引

新建知识库索引，将语料经过解析、分块、向量化后存储到向量数据库，从而构建知识库。其中关键参数配置说明如下，其他配置详情，请参见创建知识库索引。

参数	描述

参数	描述
基础配置
数据源OSS路径	配置前提条件中RAG知识库语料的OSS路径。
输出OSS路径	配置文档解析生成的中间结果和索引信息的路径。重要当使用FAISS作为向量数据库时，应用流会将生成的索引文件保存到OSS。若使用PAI默认角色（应用流开发-启动运行时时设置的实例RAM角色），应用流可以默认访问用户工作空间的默认存储Bucket，因此建议将此参数配置为当前工作空间默认存储路径所在的OSS Bucket下的任一目录。如果使用自定义角色，您需要为自定义角色授予OSS的访问权限（建议授予AliyunOSSFullAccess权限），详情请参见为RAM角色授权。
Embedding模型和数据库
Embedding类型	选择通用Embedding模型。
Embedding连接	选择2.2 创建Embedding模型服务连接中创建的Embedding模型服务连接。
向量数据库类型	选择向量数据库Milvus。
向量数据库连接	选择2.3 创建向量数据库连接中创建的Milvus数据库连接。
数据表名	配置前提条件中创建Milvus数据库的Collection。
专有网络配置
专有网络配置	请确保所配置的专有网络与Milvus实例保持一致，或确保已选的专有网络和Milvus实例所在的专有网络已经互通。

4. 创建并运行RAG应用流

进入LangStudio，选择工作空间后，在应用流页签下单击新建应用流，创建RAG应用流。
启动运行时：单击右上角创建运行时并进行配置。注：在进行Python节点解析或查看更多工具时，需要保证运行时已启动。
关键参数说明：
专有网络配置：选择前提条件中创建Milvus实例时的专有网络，或确保已选的专有网络和Milvus实例所在的专有网络已经互通。
开发应用流。
应用流中的其余配置保持默认或根据实际需求进行配置，关键节点配置如下：
- 知识库检索：在知识库中检索与用户问题相关的文本。
  - 知识库索引名称：选择3. 创建知识库索引中创建的知识库索引。
  - Top K：返回Top K条匹配的数据。
- 大模型节点：使用检索到的文档作为上下文，与用户问题一起发送给大语言模型，生成回答。
  - 模型设置：选择2.1 创建LLM服务连接中创建的连接。
  - 对话历史：是否启用对话历史，将历史对话信息作为输入变量。
关于各节点组件详情，请参见应用流开发。
调试/运行：单击右上角运行，开始执行应用流。关于应用流运行时的常见问题，请参见常见问题。
查看链路：单击生成答案下的查看链路，查看Trace详情或拓扑视图。