CXG RAG 知识库配置

更新时间:
复制为 MD 格式

知识库文件配置 RAG Setting

前提条件

  1. 已创建 RAG 连接器

  2. 完成 Integration User 相关配置

  3. 操作者具备CXG_Admin 权限集组 或者 CXG_Manage_RAG_Integration_and_Data_Library 权限集

操作步骤

  1. 前往 Salesforce, 打开 CXG - Setup。

  2. 打开 RAG Settings ⻚⾯,点击创建。

  3. 填写知识库的名称,描述,选择Content Document,Local Files , Knowledge 其中⼀种来源类型。

上传 Content Document 类型的内容

如果选择 Files 来源类型

  1. 前往 Salesforce 导航图标搜索 Files( 非 CMS Workspace Content ),可以在 Files 中上传文件。

  2. 当前版本支持在 Data Library 中选择 Public Library 的文件包括分享过给别人的(Owned by me and shared with others),别人分享给你 (Shared with me),或者 Library 中的文件,也支持 Personal Library 的文件,即自己拥有的文件 (Owned by me)。

  3. 上传 Files 类型的文件时,将会创建一个 ContentDocumentLink 将选中的 ContentDocument 对象关联到当前的知识库,有权限访问这个知识库的用户将有权限访问选择的 Files。

  4. 文件上传限制参考Files文件上传要求,其中存储基于已购买的 Salesforce 许可证的数量。可以购买额外的存储空间。

Step 1.在 Files 上传文件

操作步骤

说明

App Launcher中打开Sales或其他App,进入Files。

image.png

上传文件

(知识库格式⽀持 txt, pptx, ppt, pdf, html, xlsx, xls, docx, csv, md)

image.png

Step 2.新建Files 类型的 Data Library,并同步文件

操作步骤

说明

前往 CXG - Setup,打开 RAG Settings ⻚⾯,点击创建。

输入知识库名,选择Files类型,点击Submit。

image

选择需要同步到知识库的文件,点击Submit

image

上传 Content Document 类型的⽂件时,将会创建⼀个 ContentDocumentLink 将选中的 ContentDocument 对象关联到当前的知识库,有权限访问这个知识库的⽤户将有权限访问选择的 Content Document

上传 Local files 类型的内容

文件限制:当前版本支持上传最大为 15M 的文件,格式支持 txt, pptx, ppt, pdf, html, xlsx, xls, docx, csv, md。

操作步骤

说明

进入 CXG - Setup,打开 RAG Settings ⻚⾯,点击创建。

输入知识库名,选择Local files,点击Submit。

image

点击,选择需要同步到知识库的文件,点击Submit。

image.png

上传 Knowledge 类型的内容

如果选择 Knowledge 来源类型

  1. 支持上传已经发布且为最新版本的 Knowledge。

  2. 支持选择上传 Text 和 TextArea 格式的字段内容(包含标准和自定义字段)image

    说明

    Knowledge 类型知识库上传文章时,建议按照用户阅读顺序选择文件内容,例如:应该先添加Question ,再添加 Answer;否则会影响切片和检索召回效果。

前提条件

除以上前提条件,创建 Knowledge 这类知识库,需要组织拥有 Knowledge User License,也需要操作者具备 Knowledge User 的角色。

操作:前往操作者的 User 设置⻚⾯,点击编辑,选中 Knowledge User,保存完成⾓⾊分配。

Step 1.管理和发布Knowledge内容

操作步骤

说明

App Launcher中输入并跳转Knowledge。

image.png

进入任意Knowledge,点击设置,点击Edit Object

image.png

点击Page Layout,将上方Knowledge Layout字段拖入下方的Knowledge Detail Information,点击保存

image.png

Knowledge中点击新建,输入Title,系统自动填入URL Name,填写QuestionAnswer字段,点击保存

image.png

Knowledge切换到Draft Articles,选择对应的Knowledge记录,点击Publish,弹窗配置完成后点击Publish。

image.png

若您在上述步骤中发现,您的Answer 和 Question 字段不可见,请您点击右上角的Setup Menu,点击进入Service Setup,点击Service Setup Home> View All > Knowledge Setup,开始流程,选择对应User,完成流程,该字段即可见。

image.png

Step 2.新建Konwledge 类型的 Data Library,并同步文件

操作步骤

说明

进入CXG setup,点击RAG Setting,点击新建,选择Knowledge,点击提交

image

点击Add files,选择创建好的Knowledge,点击提交,就可以使用RAG索引

image.png

文件上传成功后RAG自动实现解析

  • ⽂件选择完成,点击提交。⽂件就会上传到 Rag 服务,此时 Rag 服务会对⽂件进⾏解析处理,⽂件状态为处理中。当⽂件处理完成,⽂件状态为已启⽤,意味着该⽂件已准备好被检索。

image.png

  • 知识库创建完成,默认为激活状态。RAG 服务会为知识库⾃动构建 RAG Retriever,您可以在提⽰⽣成器通过 Apex 引⽤这个知识库。

修改 Top K 的值和开启重排序模型

您可以通过编辑知识库,修改 Top K 的值和开启重排序模型。

  1. Top K 指的是根据相似度评分从知识库或向量数据库中检索出最相关的 K 个⽂本⽚段或结果,指最多召回数量,⽽不是实际召回数量。

  2. Reranking 重排序会计算候选⽂档列表与⽤户问题的语义匹配度,根据语义匹配度重新进⾏排序,从⽽改进语义排序的结果。其原理是计算⽤户问题与给定的每个候选⽂档之间的相关性分数,并返回按相关性从⾼到低排序的⽂档列表。

image.png

Citation 引用来源

引用来源会将 AI 生成的回复链接到与每个回复相关的源内容。允许用户将 LLM 回复与源数据进行比较,以验证 LLM 回复的有效性,并识别任何潜在的不准确或幻觉。

支持查看的引用来源包含 Knowledge,Salesforce Files 和 Local Files。其中,Knowledge 和 Salesforce Files 支持跳转到 Salesforce 的记录详情页中查看详情,Local Files 当前仅支持查看名称,无法跳转。

引用来源有以下优点:

  1. 可验证:可验证回复的准确性。

  2. 可信:通过提供来源表明回复基于数据,是可信的。

  3. 可深入:通过探索源数据了解更多详细信息补充 AI 回复。

引用可以通过两种方式实施:

  1. 基于标准 AI Action 的引用来源:对与 RAG 相关的 AI Actions 或 LWC 组件支持标准的引用来源。标准的引用来源具有固定的格式和样式,确保结构化和一致的用户体验。

  2. 基于提示词自定义的引用来源:在提示词中输入格式指令,例如:如果引用了知识库,请使用 Markdown 引用语法,使用编号,比如:xxx[^1]。引用需要展示 file_name 以及 external_id,比如 [^1]:file_name,external_id。