知识检索

更新时间:
复制 MD 格式

知识检索服务支持单知识库或多知识库联合检索,帮助您从企业私有知识库中精确搜索相关内容。您可以通过控制台创建和配置检索服务,也可以通过 API 集成到自有应用中。

功能概述

知识检索服务面向企业级多知识库检索场景,具备以下核心能力:

  • 多知识库联合检索:支持同时检索多个知识库(最多 15 个),无需逐库查询。

  • 高精度检索:通过 Query 改写、混合检索(向量 + 关键词)与排序模型的流水线,提供高质量的检索结果。

  • 精细化参数配置:每个知识库可独立配置向量召回数、排序模型、相似度阈值、字段过滤等参数。

  • 多模态支持:支持文本检索、图片搜索(图片知识库)以及音视频内容检索。

检索流程

知识检索服务收到查询请求后,按照以下流程返回结果:

  1. Query 改写(可选):对用户输入进行优化改写,提升检索效果。

  2. 向量检索 + 关键词检索:分别通过语义相似度和关键词匹配召回相关切片。

  3. 排序(Rerank):使用排序模型对召回结果进行精排,过滤低分切片。

  4. 返回结果:排序后对原始语义分进行加权,最终按加权分数从高到低返回切片列表。

创建检索服务

前提条件

  • 已创建至少一个知识库,且知识库中已上传并完成解析的文档。

  • 如需使用多知识库联合检索,请确保各知识库位于同一业务空间下。

操作步骤

  1. 进入知识库页面,点击顶部的知识检索标签页。

  2. 点击右上角的创建检索服务

  3. 在弹窗中填写服务名称(必填,最多 15 个字符)和描述信息(可选,最多 200 个字符),点击确认

  4. 创建成功后自动进入配置页面。点击+ 添加,绑定一个或多个知识库(最多 15 个)。

  5. 根据需要配置知识库路由混排模型混排模型模式最大召回数量等参数,详见下方配置参数说明

  6. 配置完成后,点击右上角的发布。发布后可在检索服务列表中查看状态。

配置参数说明

全局检索配置

配置页面包含以下全局参数,对所有绑定的知识库统一生效:

参数

取值范围

说明

知识库

最多 15 个

绑定要检索的知识库。点击+ 添加选择知识库,每个知识库可设置权重(权重数字越大,该知识库的检索结果在最终排序中优先级越高)。点击知识库旁的image图标可展开该知识库的独立检索参数。

知识库路由

开/关

开启后系统依据检索意图自动判断需要查询哪些知识库,无需全部检索。路由判定依赖大模型,会产生模型调用费用。

混排模型

开启后,使用混排模型对多知识库结果统一排序;关闭后,各知识库独立使用内部排序模型,结果分组返回。纯文本知识库可选:

  • 不使用模型

  • qwen3-rerank

  • qwen3-rerank(hybrid)

多模态知识库(图片知识库、视觉理解知识库)可选:

  • 不使用模型

  • qwen3-vl-rerank

混排模型模式

排序模型的工作模式。可选:

  • 问答模式:根据 QA 匹配度排序,模型假设 Query 是问题,优先匹配可能回答该 Query 的切片。

  • 相似模式:根据 Query 问答的相似度来排序,优先匹配与 Query 语义相似的切片。

  • 自定义高级模式:自定义干预重排序模型。

最大召回数量

1~20

混排后最终返回的切片总数量。

知识库独立配置

点击知识库旁的 image 图标,可展开该知识库的独立检索参数:

参数

取值范围

说明

初步向量检索 TopK

1~100

向量检索阶段初步召回的切片数量。仅基础文档问答与表格库可用。

初步关键词检索 TopK

1~100

关键词检索阶段初步召回的切片数量。仅基础文档问答与表格库可用。

排序模型

对该知识库的召回结果独立排序。基础文档问答与表格库可选 qwen3-rerank 等;多模态知识库可选 qwen3-vl-rerank。极速问答不可用。

排序模型模式

排序模型的工作模式(问答模式/相似模式)。问答模式按 QA 匹配度排序,优先匹配可能回答 Query 的切片;相似模式按语义相似度排序,优先匹配与 Query 相似的切片。仅在排序模型开启时可用。

相似度阈值

0.01~1.0

过滤排序后分数低于阈值的切片。值越高结果越精确,但可能遗漏相关内容。

最大召回数量

1~20

该知识库排序后返回的切片数量。

标签过滤

根据文档标签过滤检索范围。输入标签后回车确认,或从下拉列表中选择已有标签。

结构化字段过滤

根据文档的结构化字段过滤检索范围。仅表格库可用。

测试检索效果

检索服务发布后,可通过控制台直接测试检索效果:

  1. 在检索服务列表中,点击目标服务进入详情页。

  2. 在右侧的对话窗口中输入查询内容。

  3. 查看返回的切片结果,包括相似度分数、来源文档和检索耗时。

相关文档