知识问答服务基于大模型结合知识检索能力,支持绑定多个知识库,自动检索相关内容并生成自然语言回答。您可以通过控制台配置模型、检索参数和生成策略,也可以通过 API 集成到自有应用中。
功能概述
知识问答服务面向企业级知识库问答场景,具备以下核心能力:
智能问答:基于大模型(如 qwen3.6-plus、qwen3.7-plus)结合知识检索结果生成自然语言回答,支持表格库 NL2SQL 查询、文档层级章节查询和原文精读。
多知识库绑定:支持同时绑定多个知识库(最多 15 个),设置优先级和独立检索参数。
双检索模式:提供极速模式(单轮直接检索)和多轮智能模式(Agentic 多轮规划搜索)。
多模态能力:支持图片搜索、图片多模态理解问答、图文并茂回复。
文件预解析:支持在对话中上传文件(包括图片和文档),图片上传进行多模态理解问答,文档上传根据选择的文件解析方式处理,无需预先导入知识库。
生成控制:支持拒答策略、防泄漏保护、多模态回复和引用来源展示。
创建问答服务
前提条件
已创建至少一个知识库,且知识库中已上传并完成解析的文档。
操作步骤
进入知识库页面,点击顶部的知识问答标签页。
点击右上角的创建问答服务。
在弹窗中填写服务名称和描述信息(可选),点击确认。
创建成功后进入配置页面,配置以下内容:
选择模型(如 qwen3.6-plus)。
输入提示词(可选,最多 500 字符),用于指导模型的回答风格和行为。
选择检索模式(极速或多轮智能)。
点击+ 添加绑定知识库(最多 15 个)。
根据需要配置生成控制参数(文件预解析、拒答、防泄漏等),详见下方参数说明。
配置完成后,点击右上角的发布。
检索模式
知识问答服务支持两种检索模式:
模式 | 工作方式 | 适用场景 |
极速 | 单轮检索后直接生成回答。检索 → 生成,固定流程,低延时。 | 简单明确的问题、对响应速度敏感的场景。 |
多轮智能 | 基于大模型进行多轮规划搜索(Agentic),自动进行意图识别、Query 改写、知识库路由等操作后再生成回答。 | 复杂问题的深度问答、模糊问题的智能理解、需要跨库综合回答的场景。 |
配置参数说明
基本配置
参数 | 取值范围 | 说明 |
模型 | — | 用于生成回答的大模型。可选 qwen3.6-plus、qwen3.7-plus 等。模型旁可配置 temperature 和 enable_thinking 参数。 |
提示词 | 最多 500 字符 | 指导模型回答风格和行为的系统提示词。例如设定角色、回答语气、关注领域等。 |
检索模式 | — | 选择检索策略。可选极速(单轮检索 + 生成,支持 Query 改写开关)或多轮智能(Agentic 多轮规划搜索 + 生成,由 Agent 自动改写查询 Query,可配置 ReAct 最大轮次)。 |
知识库 | 最多 15 个 | 绑定要检索的知识库。每个知识库可通过拖拽调整排序和优先级(知识库排位次序越靠前,该库结果排序越靠前)。点击知识库旁的 |
知识库独立检索参数
点击知识库旁的
图标,可展开该知识库的独立检索参数:
参数 | 取值范围 | 说明 |
Query 改写 | 开/关 | 开启后,系统对用户输入进行改写优化,提升检索效果。极速模式下可通过此开关控制;多轮智能模式下由 Agent 自动改写。 |
初步向量检索 TopK | 1~100 | 通过向量语义相似度初步召回的切片数量。默认 50。 |
初步关键词检索 TopK | — | 通过关键词匹配初步召回的切片数量。默认 50。 |
排序模型 | — | 对初步召回结果进行精排的模型。纯文本知识库可选 qwen3-rerank、qwen3-rerank(hybrid);多模态知识库(图片/视觉理解)可选 qwen3-vl-rerank。 |
排序模型模式 | — | 排序模型的工作模式。问答模式:根据 QA 匹配度排序,模型假设 Query 是问题,优先匹配可能回答该 Query 的切片。相似模式:根据相似度排序,优先匹配与 Query 语义相似的切片。另可选自定义高级模式。 |
相似度阈值 | 0.01~1.0 | 过滤排序后分数低于阈值的切片。值越高结果越精确,但可能遗漏相关内容。 |
最大召回数量 | 1~20 | 该知识库排序后返回的切片数量。 |
标签过滤 | — | 根据文档标签过滤检索范围。输入标签后回车确认,或从下拉列表中选择已有标签。 |
结构化字段过滤 | — | 根据文档的结构化字段过滤检索范围。仅表格库可用。 |
生成控制参数
以下参数用于控制问答服务的生成行为:
参数 | 说明 |
文件预解析 | 开启后,用户可在右侧调试窗口通过附件按钮上传文件(包括图片和文档)。图片上传将进行多模态理解问答,文档上传根据选择的文件解析方式处理。提供两种解析模式:
|
拒答 | 开启后,当检索结果信息不足以回答用户问题,或涉及闲聊、敏感话题等情况时,模型会拒绝回答并返回自定义的拒答话术。支持配置触发拒答的条件和自定义拒答回复内容。 |
防泄漏 | 开启后,防止知识库原文在回答中被直接泄漏。支持配置自定义防泄漏回复话术,当检测到可能泄漏原文内容的情况时,模型会返回配置的防护回复。 |
多模态回复 | 开启后,模型回答中会包含知识库中的多模态内容(如图片),实现图文并茂的回复效果。 |
引用 | 开启后,模型回答中会展示引用来源,标注回答内容出自哪个知识库的哪个文档,便于用户溯源验证。 |
调试问答效果
问答服务配置完成后,可通过右侧的调试窗口直接测试问答效果:
在输入框中输入问题(支持上传附件,包括图片和文档)。
查看模型生成的回答,包括引用来源和检索过程。
根据回答质量调整检索参数或提示词,反复调试至满意效果。