知识问答-大模型服务平台百炼(Model Studio)-阿里云帮助中心

文档备案控制台

知识问答服务基于大模型结合知识检索能力，支持绑定多个知识库，自动检索相关内容并生成自然语言回答。您可以通过控制台配置模型、检索参数和生成策略，也可以通过 API 集成到自有应用中。

功能概述

知识问答服务面向企业级知识库问答场景，具备以下核心能力：

智能问答：基于大模型（如 qwen3.6-plus、qwen3.7-plus）结合知识检索结果生成自然语言回答，支持表格库 NL2SQL 查询、文档层级章节查询和原文精读。
多知识库绑定：支持同时绑定多个知识库（最多 15 个），设置优先级和独立检索参数。
双检索模式：提供极速模式（单轮直接检索）和多轮智能模式（Agentic 多轮规划搜索）。
多模态能力：支持图片搜索、图片多模态理解问答、图文并茂回复。
文件预解析：支持在对话中上传文件（包括图片和文档），图片上传进行多模态理解问答，文档上传根据选择的文件解析方式处理，无需预先导入知识库。
生成控制：支持拒答策略、防泄漏保护、多模态回复和引用来源展示。

创建问答服务

前提条件

已创建至少一个知识库，且知识库中已上传并完成解析的文档。

操作步骤

进入知识库页面，点击顶部的知识问答标签页。
点击右上角的创建问答服务。
在弹窗中填写服务名称和描述信息（可选），点击确认。
创建成功后进入配置页面，配置以下内容：
- 选择模型（如 qwen3.6-plus）。
- 输入提示词（可选，最多 500 字符），用于指导模型的回答风格和行为。
- 选择检索模式（极速或多轮智能）。
- 点击+ 添加绑定知识库（最多 15 个）。
根据需要配置生成控制参数（文件预解析、拒答、防泄漏等），详见下方参数说明。
配置完成后，点击右上角的发布。

检索模式

知识问答服务支持两种检索模式：

模式	工作方式	适用场景
极速	单轮检索后直接生成回答。检索 → 生成，固定流程，低延时。	简单明确的问题、对响应速度敏感的场景。
多轮智能	基于大模型进行多轮规划搜索（Agentic），自动进行意图识别、Query 改写、知识库路由等操作后再生成回答。	复杂问题的深度问答、模糊问题的智能理解、需要跨库综合回答的场景。

配置参数说明

基本配置

参数	取值范围	说明
模型	—	用于生成回答的大模型。可选 qwen3.6-plus、qwen3.7-plus 等。模型旁可配置 temperature 和 enable_thinking 参数。
提示词	最多 500 字符	指导模型回答风格和行为的系统提示词。例如设定角色、回答语气、关注领域等。
检索模式	—	选择检索策略。可选极速（单轮检索 + 生成，支持 Query 改写开关）或多轮智能（Agentic 多轮规划搜索 + 生成，由 Agent 自动改写查询 Query，可配置 ReAct 最大轮次）。
知识库	最多 15 个	绑定要检索的知识库。每个知识库可通过拖拽调整排序和优先级（知识库排位次序越靠前，该库结果排序越靠前）。点击知识库旁的图标可展开独立检索参数。

知识库独立检索参数

点击知识库旁的图标，可展开该知识库的独立检索参数：

参数	取值范围	说明
Query 改写	开/关	开启后，系统对用户输入进行改写优化，提升检索效果。极速模式下可通过此开关控制；多轮智能模式下由 Agent 自动改写。
初步向量检索 TopK	1~100	通过向量语义相似度初步召回的切片数量。默认 50。
初步关键词检索 TopK	—	通过关键词匹配初步召回的切片数量。默认 50。
排序模型	—	对初步召回结果进行精排的模型。纯文本知识库可选 qwen3-rerank、qwen3-rerank(hybrid)；多模态知识库（图片/视觉理解）可选 qwen3-vl-rerank。
排序模型模式	—	排序模型的工作模式。问答模式：根据 QA 匹配度排序，模型假设 Query 是问题，优先匹配可能回答该 Query 的切片。相似模式：根据相似度排序，优先匹配与 Query 语义相似的切片。另可选自定义高级模式。
相似度阈值	0.01~1.0	过滤排序后分数低于阈值的切片。值越高结果越精确，但可能遗漏相关内容。
最大召回数量	1~20	该知识库排序后返回的切片数量。
标签过滤	—	根据文档标签过滤检索范围。输入标签后回车确认，或从下拉列表中选择已有标签。
结构化字段过滤	—	根据文档的结构化字段过滤检索范围。仅表格库可用。

生成控制参数

以下参数用于控制问答服务的生成行为：

参数	说明
文件预解析	开启后，用户可在右侧调试窗口通过附件按钮上传文件（包括图片和文档）。图片上传将进行多模态理解问答，文档上传根据选择的文件解析方式处理。提供两种解析模式：全文引用：解析文件完整内容后直接作为上下文提供给模型，适用于需要理解文件全文的场景。切片检索：将文件切片后进行检索，同时结合知识库检索结果生成回答，适用于文件内容较多需要精确匹配的场景。
拒答	开启后，当检索结果信息不足以回答用户问题，或涉及闲聊、敏感话题等情况时，模型会拒绝回答并返回自定义的拒答话术。支持配置触发拒答的条件和自定义拒答回复内容。
防泄漏	开启后，防止知识库原文在回答中被直接泄漏。支持配置自定义防泄漏回复话术，当检测到可能泄漏原文内容的情况时，模型会返回配置的防护回复。
多模态回复	开启后，模型回答中会包含知识库中的多模态内容（如图片），实现图文并茂的回复效果。
引用	开启后，模型回答中会展示引用来源，标注回答内容出自哪个知识库的哪个文档，便于用户溯源验证。

调试问答效果

问答服务配置完成后，可通过右侧的调试窗口直接测试问答效果：

在输入框中输入问题（支持上传附件，包括图片和文档）。
查看模型生成的回答，包括引用来源和检索过程。
根据回答质量调整检索参数或提示词，反复调试至满意效果。

相关文档

上一篇：知识检索下一篇：Skill

该文章对您有帮助吗？