知识检索服务支持单知识库或多知识库联合检索,帮助您从企业私有知识库中精确搜索相关内容。您可以通过控制台创建和配置检索服务,也可以通过 API 集成到自有应用中。
功能概述
知识检索服务面向企业级多知识库检索场景,具备以下核心能力:
多知识库联合检索:支持同时检索多个知识库(最多 15 个),无需逐库查询。
高精度检索:通过 Query 改写、混合检索(向量 + 关键词)与排序模型的流水线,提供高质量的检索结果。
精细化参数配置:每个知识库可独立配置向量召回数、排序模型、相似度阈值、字段过滤等参数。
多模态支持:支持文本检索、图片搜索(图片知识库)以及音视频内容检索。
检索流程
知识检索服务收到查询请求后,按照以下流程返回结果:
Query 改写(可选):对用户输入进行优化改写,提升检索效果。
向量检索 + 关键词检索:分别通过语义相似度和关键词匹配召回相关切片。
排序(Rerank):使用排序模型对召回结果进行精排,过滤低分切片。
返回结果:排序后对原始语义分进行加权,最终按加权分数从高到低返回切片列表。
创建检索服务
前提条件
已创建至少一个知识库,且知识库中已上传并完成解析的文档。
如需使用多知识库联合检索,请确保各知识库位于同一业务空间下。
操作步骤
配置参数说明
全局检索配置
配置页面包含以下全局参数,对所有绑定的知识库统一生效:
参数 | 取值范围 | 说明 |
知识库 | 最多 15 个 | 绑定要检索的知识库。点击+ 添加选择知识库,每个知识库可设置权重(权重数字越大,该知识库的检索结果在最终排序中优先级越高)。点击知识库旁的 |
知识库路由 | 开/关 | 开启后系统依据检索意图自动判断需要查询哪些知识库,无需全部检索。路由判定依赖大模型,会产生模型调用费用。 |
混排模型 | — | 开启后,使用混排模型对多知识库结果统一排序;关闭后,各知识库独立使用内部排序模型,结果分组返回。纯文本知识库可选:
多模态知识库(图片知识库、视觉理解知识库)可选:
|
混排模型模式 | — | 排序模型的工作模式。可选:
|
最大召回数量 | 1~20 | 混排后最终返回的切片总数量。 |
知识库独立配置
点击知识库旁的
图标,可展开该知识库的独立检索参数:
参数 | 取值范围 | 说明 |
初步向量检索 TopK | 1~100 | 向量检索阶段初步召回的切片数量。仅基础文档问答与表格库可用。 |
初步关键词检索 TopK | 1~100 | 关键词检索阶段初步召回的切片数量。仅基础文档问答与表格库可用。 |
排序模型 | — | 对该知识库的召回结果独立排序。基础文档问答与表格库可选 qwen3-rerank 等;多模态知识库可选 qwen3-vl-rerank。极速问答不可用。 |
排序模型模式 | — | 排序模型的工作模式(问答模式/相似模式)。问答模式按 QA 匹配度排序,优先匹配可能回答 Query 的切片;相似模式按语义相似度排序,优先匹配与 Query 相似的切片。仅在排序模型开启时可用。 |
相似度阈值 | 0.01~1.0 | 过滤排序后分数低于阈值的切片。值越高结果越精确,但可能遗漏相关内容。 |
最大召回数量 | 1~20 | 该知识库排序后返回的切片数量。 |
标签过滤 | — | 根据文档标签过滤检索范围。输入标签后回车确认,或从下拉列表中选择已有标签。 |
结构化字段过滤 | — | 根据文档的结构化字段过滤检索范围。仅表格库可用。 |
测试检索效果
检索服务发布后,可通过控制台直接测试检索效果:
在检索服务列表中,点击目标服务进入详情页。
在右侧的对话窗口中输入查询内容。
查看返回的切片结果,包括相似度分数、来源文档和检索耗时。