知识问答

更新时间:
复制 MD 格式

知识问答服务基于大模型结合知识检索能力,支持绑定多个知识库,自动检索相关内容并生成自然语言回答。您可以通过控制台配置模型、检索参数和生成策略,也可以通过 API 集成到自有应用中。

功能概述

知识问答服务面向企业级知识库问答场景,具备以下核心能力:

  • 智能问答:基于大模型(如 qwen3.6-plus、qwen3.7-plus)结合知识检索结果生成自然语言回答,支持表格库 NL2SQL 查询、文档层级章节查询和原文精读。

  • 多知识库绑定:支持同时绑定多个知识库(最多 15 个),设置优先级和独立检索参数。

  • 双检索模式:提供极速模式(单轮直接检索)和多轮智能模式(Agentic 多轮规划搜索)。

  • 多模态能力:支持图片搜索、图片多模态理解问答、图文并茂回复。

  • 文件预解析:支持在对话中上传文件(包括图片和文档),图片上传进行多模态理解问答,文档上传根据选择的文件解析方式处理,无需预先导入知识库。

  • 生成控制:支持拒答策略、防泄漏保护、多模态回复和引用来源展示。

创建问答服务

前提条件

  • 已创建至少一个知识库,且知识库中已上传并完成解析的文档。

操作步骤

  1. 进入知识库页面,点击顶部的知识问答标签页。

  2. 点击右上角的创建问答服务

  3. 在弹窗中填写服务名称描述信息(可选),点击确认

  4. 创建成功后进入配置页面,配置以下内容:

    • 选择模型(如 qwen3.6-plus)。

    • 输入提示词(可选,最多 500 字符),用于指导模型的回答风格和行为。

    • 选择检索模式(极速或多轮智能)。

    • 点击+ 添加绑定知识库(最多 15 个)。

  5. 根据需要配置生成控制参数(文件预解析、拒答、防泄漏等),详见下方参数说明。

  6. 配置完成后,点击右上角的发布

检索模式

知识问答服务支持两种检索模式:

模式

工作方式

适用场景

极速

单轮检索后直接生成回答。检索 → 生成,固定流程,低延时。

简单明确的问题、对响应速度敏感的场景。

多轮智能

基于大模型进行多轮规划搜索(Agentic),自动进行意图识别、Query 改写、知识库路由等操作后再生成回答。

复杂问题的深度问答、模糊问题的智能理解、需要跨库综合回答的场景。

配置参数说明

基本配置

参数

取值范围

说明

模型

用于生成回答的大模型。可选 qwen3.6-plus、qwen3.7-plus 等。模型旁可配置 temperature 和 enable_thinking 参数。

提示词

最多 500 字符

指导模型回答风格和行为的系统提示词。例如设定角色、回答语气、关注领域等。

检索模式

选择检索策略。可选极速(单轮检索 + 生成,支持 Query 改写开关)或多轮智能(Agentic 多轮规划搜索 + 生成,由 Agent 自动改写查询 Query,可配置 ReAct 最大轮次)。

知识库

最多 15 个

绑定要检索的知识库。每个知识库可通过拖拽调整排序和优先级(知识库排位次序越靠前,该库结果排序越靠前)。点击知识库旁的 image 图标可展开独立检索参数。

知识库独立检索参数

点击知识库旁的 image图标,可展开该知识库的独立检索参数:

参数

取值范围

说明

Query 改写

开/关

开启后,系统对用户输入进行改写优化,提升检索效果。极速模式下可通过此开关控制;多轮智能模式下由 Agent 自动改写。

初步向量检索 TopK

1~100

通过向量语义相似度初步召回的切片数量。默认 50。

初步关键词检索 TopK

通过关键词匹配初步召回的切片数量。默认 50。

排序模型

对初步召回结果进行精排的模型。纯文本知识库可选 qwen3-rerank、qwen3-rerank(hybrid);多模态知识库(图片/视觉理解)可选 qwen3-vl-rerank。

排序模型模式

排序模型的工作模式。问答模式:根据 QA 匹配度排序,模型假设 Query 是问题,优先匹配可能回答该 Query 的切片。相似模式:根据相似度排序,优先匹配与 Query 语义相似的切片。另可选自定义高级模式

相似度阈值

0.01~1.0

过滤排序后分数低于阈值的切片。值越高结果越精确,但可能遗漏相关内容。

最大召回数量

1~20

该知识库排序后返回的切片数量。

标签过滤

根据文档标签过滤检索范围。输入标签后回车确认,或从下拉列表中选择已有标签。

结构化字段过滤

根据文档的结构化字段过滤检索范围。仅表格库可用。

生成控制参数

以下参数用于控制问答服务的生成行为:

参数

说明

文件预解析

开启后,用户可在右侧调试窗口通过附件按钮上传文件(包括图片和文档)。图片上传将进行多模态理解问答,文档上传根据选择的文件解析方式处理。提供两种解析模式:

  • 全文引用:解析文件完整内容后直接作为上下文提供给模型,适用于需要理解文件全文的场景。

  • 切片检索:将文件切片后进行检索,同时结合知识库检索结果生成回答,适用于文件内容较多需要精确匹配的场景。

拒答

开启后,当检索结果信息不足以回答用户问题,或涉及闲聊、敏感话题等情况时,模型会拒绝回答并返回自定义的拒答话术。支持配置触发拒答的条件和自定义拒答回复内容。

防泄漏

开启后,防止知识库原文在回答中被直接泄漏。支持配置自定义防泄漏回复话术,当检测到可能泄漏原文内容的情况时,模型会返回配置的防护回复。

多模态回复

开启后,模型回答中会包含知识库中的多模态内容(如图片),实现图文并茂的回复效果。

引用

开启后,模型回答中会展示引用来源,标注回答内容出自哪个知识库的哪个文档,便于用户溯源验证。

调试问答效果

问答服务配置完成后,可通过右侧的调试窗口直接测试问答效果:

  1. 在输入框中输入问题(支持上传附件,包括图片和文档)。

  2. 查看模型生成的回答,包括引用来源和检索过程。

  3. 根据回答质量调整检索参数或提示词,反复调试至满意效果。

相关文档