本文介绍AI RAG。
简介
大模型具有一个显著的局限性,那就是它们的知识截止到模型被训练的数据。一旦训练完成,模型就无法获取或学习新的信息。此外,大型语言模型的训练数据虽然浩如烟海,但仍然有可能缺少某些领域的信息,或者对某些主题的覆盖不够深入,针对这些细领域的查询可能会产生不够精确或缺乏深度的结果。检索增强生成(RAG)技术能够利用检索系统从大规模的数据库中找到相关信息,然后将这些信息提供给文本生成模型以帮助生成更精确、更丰富、更符合实际情况的文本。
Higress 通过对接阿里云向量检索服务能够快速实现RAG功能,流程如图所示:
配置说明
名称 | 数据类型 | 填写要求 | 默认值 | 描述 |
| string | 必填 | - | 用于在访问通义千问服务时进行认证的令牌 |
| string | 必填 | - | 通义千问服务名 |
| int | 必填 | - | 通义千问服务端口 |
| string | 必填 | - | 访问通义千问服务时域名 |
| string | 必填 | - | 用于在访问阿里云向量检索服务时进行认证的令牌 |
| string | 必填 | - | 阿里云向量检索服务名 |
| int | 必填 | - | 阿里云向量检索服务端口 |
| string | 必填 | - | 访问阿里云向量检索服务时域名 |
示例
CEC-Corpus 数据集包含 332 篇突发事件的新闻报道的语料和标注数据,提取其原始的新闻稿文本,将其向量化后添加到阿里云向量检索服务。文本向量化的教程可以参考基于向量检索服务与TextEmbedding实现语义搜索。
文档内容是否对您有帮助?