知识检索-大模型服务平台百炼(Model Studio)-阿里云帮助中心

文档备案控制台

知识检索服务支持单知识库或多知识库联合检索，帮助您从企业私有知识库中精确搜索相关内容。您可以通过控制台创建和配置检索服务，也可以通过 API 集成到自有应用中。

功能概述

知识检索服务面向企业级多知识库检索场景，具备以下核心能力：

多知识库联合检索：支持同时检索多个知识库（最多 15 个），无需逐库查询。
高精度检索：通过 Query 改写、混合检索（向量 + 关键词）与排序模型的流水线，提供高质量的检索结果。
精细化参数配置：每个知识库可独立配置向量召回数、排序模型、相似度阈值、字段过滤等参数。
多模态支持：支持文本检索、图片搜索（图片知识库）以及音视频内容检索。

检索流程

知识检索服务收到查询请求后，按照以下流程返回结果：

Query 改写（可选）：对用户输入进行优化改写，提升检索效果。
向量检索 + 关键词检索：分别通过语义相似度和关键词匹配召回相关切片。
排序（Rerank）：使用排序模型对召回结果进行精排，过滤低分切片。
返回结果：排序后对原始语义分进行加权，最终按加权分数从高到低返回切片列表。

创建检索服务

前提条件

已创建至少一个知识库，且知识库中已上传并完成解析的文档。
如需使用多知识库联合检索，请确保各知识库位于同一业务空间下。

操作步骤

进入知识库页面，点击顶部的知识检索标签页。
点击右上角的创建检索服务。
在弹窗中填写服务名称（必填，最多 15 个字符）和描述信息（可选，最多 200 个字符），点击确认。
创建成功后自动进入配置页面。点击+ 添加，绑定一个或多个知识库（最多 15 个）。
根据需要配置知识库路由、混排模型、混排模型模式和最大召回数量等参数，详见下方配置参数说明。
配置完成后，点击右上角的发布。发布后可在检索服务列表中查看状态。

配置参数说明

全局检索配置

配置页面包含以下全局参数，对所有绑定的知识库统一生效：

参数	取值范围	说明
知识库	最多 15 个	绑定要检索的知识库。点击+ 添加选择知识库，每个知识库可设置权重（权重数字越大，该知识库的检索结果在最终排序中优先级越高）。点击知识库旁的图标可展开该知识库的独立检索参数。
知识库路由	开/关	开启后系统依据检索意图自动判断需要查询哪些知识库，无需全部检索。路由判定依赖大模型，会产生模型调用费用。
混排模型	—	开启后，使用排序模型对多知识库结果统一排序；关闭后，各知识库独立使用内部排序模型，结果分组返回。纯文本知识库可选：不使用模型 qwen3-rerank qwen3-rerank(hybrid) 多模态知识库（图片知识库、视觉理解知识库）可选：不使用模型 qwen3-vl-rerank
混排模型模式	—	排序模型的工作模式。可选：问答模式：根据 QA 匹配度排序，模型假设 Query 是问题，优先匹配可能回答该 Query 的切片。相似模式：根据 Query 问答的相似度来排序,优先匹配与 Query 语义相似的切片。自定义高级模式：自定义干预重排序模型。
最大召回数量	1~20	混排后最终返回的切片总数量。

知识库独立配置

点击知识库旁的图标，可展开该知识库的独立检索参数：

参数	取值范围	说明
初步向量检索 TopK	1~100	向量检索阶段初步召回的切片数量。仅基础文档问答与表格库可用。
初步关键词检索 TopK	1~100	关键词检索阶段初步召回的切片数量。仅基础文档问答与表格库可用。
排序模型	—	对该知识库的召回结果独立排序。基础文档问答与表格库可选 qwen3-rerank 等；多模态知识库可选 qwen3-vl-rerank。极速问答不可用。
排序模型模式	—	排序模型的工作模式（问答模式/相似模式）。问答模式按 QA 匹配度排序，优先匹配可能回答 Query 的切片；相似模式按语义相似度排序，优先匹配与 Query 相似的切片。仅在排序模型开启时可用。
相似度阈值	0.01~1.0	过滤排序后分数低于阈值的切片。值越高结果越精确，但可能遗漏相关内容。
最大召回数量	1~20	该知识库排序后返回的切片数量。
标签过滤	—	根据文档标签过滤检索范围。输入标签后回车确认，或从下拉列表中选择已有标签。
结构化字段过滤	—	根据文档的结构化字段过滤检索范围。仅表格库可用。

测试检索效果

检索服务发布后，可通过控制台直接测试检索效果：

在检索服务列表中，点击目标服务进入详情页。
在右侧的对话窗口中输入查询内容。
查看返回的切片结果，包括相似度分数、来源文档和检索耗时。

相关文档

上一篇：知识库计费说明下一篇：知识问答

该文章对您有帮助吗？