文档

AI RAG

更新时间:

本文介绍AI RAG。

简介

大模型具有一个显著的局限性,那就是它们的知识截止到模型被训练的数据。一旦训练完成,模型就无法获取或学习新的信息。此外,大型语言模型的训练数据虽然浩如烟海,但仍然有可能缺少某些领域的信息,或者对某些主题的覆盖不够深入,针对这些细领域的查询可能会产生不够精确或缺乏深度的结果。检索增强生成(RAG)技术能够利用检索系统从大规模的数据库中找到相关信息,然后将这些信息提供给文本生成模型以帮助生成更精确、更丰富、更符合实际情况的文本。

Higress 通过对接阿里云向量检索服务能够快速实现RAG功能,流程如图所示:

image

配置说明

名称

数据类型

填写要求

默认值

描述

dashscope.apiKey

string

必填

-

用于在访问通义千问服务时进行认证的令牌

dashscope.serviceName

string

必填

-

通义千问服务名

dashscope.servicePort

int

必填

-

通义千问服务端口

dashscope.domain

string

必填

-

访问通义千问服务时域名

dashvector.apiKey

string

必填

-

用于在访问阿里云向量检索服务时进行认证的令牌

dashvector.serviceName

string

必填

-

阿里云向量检索服务名

dashvector.servicePort

int

必填

-

阿里云向量检索服务端口

dashvector.domain

string

必填

-

访问阿里云向量检索服务时域名

示例

CEC-Corpus 数据集包含 332 篇突发事件的新闻报道的语料和标注数据,提取其原始的新闻稿文本,将其向量化后添加到阿里云向量检索服务。文本向量化的教程可以参考基于向量检索服务与TextEmbedding实现语义搜索

image