知识库用于为大模型补充私有数据和最新信息。基于 RAG(检索增强生成)技术,大模型在生成回答前会先从知识库中检索相关内容,从而提升回答的准确性。
无专属知识库的应用 无专属知识库时,大模型无法准确回答特定领域的问题。
| 有专属知识库的应用 引入专属知识库后,大模型可准确回答特定领域的问题。
|
支持的模型
以下模型支持使用知识库。配置千问使用知识库教程
预置模型(阿里云百炼支持的标准模型) | 自定义模型(在阿里云百炼调优后的模型) |
| 指基于以下模型调优后的自定义模型。
|
上述列表随时可能更新。请以在 应用管理 页面创建应用时实际可选的模型为准。
工作原理
知识库支持对私有数据或文件进行语义检索,可找出语义相同或相近的内容,即使关键词匹配度极低甚至为零。
更多详细信息,请参见阿里云大模型ACA课程的检索增强生成。
快速开始
本节介绍如何无需编写代码,快速构建一个能够回答特定领域问题(以"阿里云百炼手机"为例)的大模型问答应用。
1. 构建知识库
进入知识库,选择标准版或旗舰版点击创建知识库;
填写知识库名称和知识库描述,其余设置保持默认,点击下一步。
选择默认类目,上传阿里云百炼系列手机产品介绍.docx文件。点击下一步,然后点击完成。
2. 集成到业务应用
知识库创建后,可将其关联至同一业务空间下的阿里云百炼应用或外部应用,以处理检索请求。
集成到智能体应用
进入应用管理页面,找到目标智能体应用,点击卡片上的配置,并为应用选择模型。
点击页面上文档知识库右侧的 + 按钮,添加上一步创建的知识库。相似度阈值和权重可保持默认。
在页面右侧的输入框中输入问题,大模型将基于所构建的知识库进行回答。
例如:"请帮我挑选一款拍照效果最好的阿里云百炼手机,价格在3000元以内。"
集成到工作流应用
进入应用管理页面,找到目标工作流应用,点击卡片上的配置。将知识库节点拖入画布,连接在开始节点之后。
配置知识库节点:
输入:在变量名
content右侧的值下拉列表中,选择。下拉列表为树形结构,需展开"内置变量"分组后选择 query。选择知识库:知识库节点支持以下两种选择方式。
选择固定知识库:从下拉菜单中选择上一步创建的知识库。适用于每次调用同一知识库的场景。
动态引入:配置
CodeList变量,根据上游节点的输出动态指定知识库。适用于需根据不同输入检索不同知识库的场景。
设置 TopK(可选):决定返回给下游节点(通常为大模型节点)的知识片段数量。
增大该值通常能提升大模型回答的准确性,但会相应增加大模型的输入 Token 消耗。
将大模型节点拖入画布,连接在知识库节点之后、结束节点之前。
配置大模型节点:
在模型配置列表中,为节点选择模型。
在提示词中,输入指示大模型使用知识库的提示词。输入"/"可插入
result变量(表示知识库检索返回的结果)。
配置结束节点:输入
/,选择,输出大模型返回的结果。点击页面右上角的测试,在页面右侧的输入框中输入问题,大模型将基于所构建的知识库进行回答。
例如:"请帮我挑选一款拍照效果最好的阿里云百炼手机,价格在3000元以内。"
集成到外部应用
除在阿里云百炼内构建应用外,也可通过阿里云百炼SDK调用知识库的检索能力,为外部 AI 应用提供检索服务。
具体集成步骤,请参见知识库API指南。
3. 优化知识库效果(可选)
若问答过程中出现知识召回不完整或内容不准确的情况,请参见知识库效果优化。
操作指南
知识库ID: 即每个知识库卡片上 ID 字段的值,用于API调用等场景。创建知识库
点击创建知识库后,首先选择知识库规格(标准版:0.03 元/小时,旗舰版:0.2 元/小时),然后按三步完成创建:填写基础信息并选择知识库类型、配置数据来源、设置索引参数。
在知识库页面,点击创建知识库。
填写基础信息
根据应用场景选择合适的知识库类型(单一知识库不支持同时选择多个类型)。选择文档搜索类型后,还需选择使用场景(基础文档问答、图文并茂回复、视觉理解(富文本文档)或极速问答):
基础文档问答:适用于纯文本文档的语义检索。
图文并茂回复:适用于需要返回图文混排内容的场景。
视觉理解(富文本文档):使用多模态向量模型对 PDF、图片等富文本文档进行视觉级理解和索引,保留原始版面信息。适合含有复杂排版、图表、公式的文档,支持文字、图片和图文组合三种命中测试模式。
极速问答:针对检索速度进行优化,适合高度结构化或简单文档类型(如 FAQ、产品参数表等),提供极速低延时的问答体验。索引配置与基础文档问答一致,差异在于后端检索策略针对低延迟场景进行了专项优化。仅支持文本查询,不支持图片输入。
选择视觉理解后,向量模型将自动切换为 qwen3 多模态向量(qwen3-vl-embedding),不可更改。
创建后,知识库类型不可更改。
文档搜索(检索场景)
适用场景:
适用于企业内部文档、产品手册等非结构化数据(即未按预定义表结构组织的数据,包含文本、表格和图片)的检索。
若文件包含图片,且需阿里云百炼应用在回答中返回,请选择文档搜索。
选择连接器:选择指定数据连接器。如未创建数据连接器,请参阅数据连接。
数据来源:支持本地上传文件或从阿里云对象存储OSS导入。
数据查询(Chatbot 或 NL2SQL 场景)
适用场景:
适合构建基于结构化数据(按预定义表结构组织的数据)的问答系统,例如 FAQ、商品数据、人员信息查询助手等。
若数据为完整的 FAQ 问答对,请选择数据查询。例如,Excel 文件包含两列,分别为
问题和答案。数据查询类知识库支持将问题列用于知识库检索,答案列用于大模型回答参考。文档搜索类知识库无法实现此效果。
支持导入多个Excel文件,但要求各文件的表结构完全一致。
选择连接器:选择指定的数据连接器。如尚未创建数据连接器,请参阅数据连接。
数据源接入:支持本地上传 XLS 或 XLSX 文件,或从阿里云数据库RDS导入数据。
图片问答(图搜场景)
适用场景:
适合构建以图搜图、以图搜"图文"的多模态检索应用,如商品导购助手、视觉问答助手等。
选择连接器:选择指定的数据连接器。如尚未创建数据连接器,请参阅数据连接。
数据源接入:支持本地上传 XLS 或 XLSX 文件,或从阿里云数据库RDS导入数据。
XLS、XLSX 文件 或RDS数据表 中需包含 公开可访问 的图片 URL,以便构建图片索引。详见下方创建说明。
音视频搜索(音视频内容检索分析场景)
适用场景:
构建基于音视频内容的智能检索与问答应用,如直播回放问答、课程助教、客服质检等。
基于多模态内容进行二次创作(根据文字需求从知识库检索音视频片段,生成脚本、字幕或剪辑建议)。
选择连接器:选择指定的数据连接器。如尚未创建数据连接器,请参阅数据连接。
数据源接入:支持本地上传音视频文件,或从阿里云对象存储OSS导入。支持的音频格式:MP3、WAV、AAC、FLAC、OGG、M4A、WMA;支持的视频格式:MP4、AVI、MOV、MKV、FLV、WMV。
使用场景可根据需求选择基础文档问答、图文并茂回复、视觉理解(富文本文档)或极速问答(适用于高度结构化或简单文档类型,任务明确,提供极低延迟的问答体验)。
在请求高峰时段,创建过程可能需要数小时(取决于数据量),请耐心等待。
更新知识库
知识库内容的任何变更均会实时同步到所有引用该知识库的应用中。
文档搜索类知识库
自动更新(推荐)
通过对象存储OSS管理文件,借助函数计算 FC 监听文件变更事件,自动同步更新至知识库,实现知识的实时更新。详见告别手动操作,让AI知识库自动更新。
手动更新
在知识库页面,找到目标知识库,单击卡片上的查看详情。
如何新增文件:单击上传数据,勾选数据连接器中的已有文件。
如何删除文件:找到目标文件后,单击其右侧的删除。
如何修改文件内容:当前不支持文件的原地更新或覆盖上传。需先删除知识库中的旧版本文件,再将修改后的新版本文件重新导入知识库。
注意:保留旧版本文件可能导致过时内容被检索和召回。
数据查询、图片问答类知识库
说明 :图片问答类知识库的详情页没有直接的 上传数据 按钮,需通过 查看数据源 链接跳转到连接器详情页进行数据更新操作。
自动更新(推荐)
使用阿里云关系型数据库RDS或自建MySQL管理知识数据,可实现知识库的自动同步更新(延迟通常为分钟级,请求高峰期可能为小时级),详见集成MySQL数据至知识库。
手动更新
当知识库的数据源为应用数据中的数据表时,只能手动更新,分为以下两步。
步骤一:更新数据表
进入数据连接页签,在左侧列表中选择目标数据表,单击上传数据。
如何插入新数据:导入类型选择增量上传。需上传一个仅包含表头和新增数据行的Excel文件。
文件表头须与当前表结构一致。可使用页面上的 下载模板 功能获取标准表头文件,并在该文件中直接填写新数据。
如何删除数据:导入类型选择覆盖上传。需上传一个包含表头及最新完整数据(已移除待删除记录)的Excel文件。
如何获取全量数据:单击页面上的
下载XLSX格式数据。如何修改数据:导入类型选择覆盖上传。需上传一个包含表头及最新完整数据(已包含相应修改)的Excel文件。
步骤二:将变更同步至知识库
返回知识库列表,找到目标知识库,单击卡片上的查看详情。单击数据表左上方的
图标,确认后即可将数据表的最新内容同步至知识库。每次更新后仍需手动重复以上步骤 。
音视频搜索类知识库
编辑知识库
知识库创建后,仅支持修改知识库名称、知识库描述和相似度阈值,其他配置均无法更改(如需更改,须删除并重新创建知识库)。编辑操作仅支持通过控制台进行,无对应API。
操作步骤:在知识库页面,找到目标知识库,单击卡片上的
,再单击编辑。注意:同一知识库每个自然日最多允许变配1次,超出后操作将被静默拒绝(无错误提示)。
删除知识库
删除操作不可逆,请谨慎操作。
删除知识库前,建议先解除其与所有已发布的阿里云百炼应用的关联。
已关联的未发布应用不影响删除操作。
变更配置
旗舰版提供RCU以保障高QPS下的检索性能,并支持更大的存储容量;标准版适合开发测试或低并发场景。
标准版与旗舰版支持互转。旗舰版的RCU数量支持修改。
同一知识库每个自然日最多允许变配1次。
RCU: RCU(Retrieval Compute Unit)是知识库检索并发能力的度量单位。1 RCU ≈ 支撑在线检索最高50 QPS。RCU越大,可支撑的并发数越高。
注意:
如果知识库(旗舰版)使用平台存储,降级为标准版前,需将已用存储空间降至80 GB以下。
可通过删除知识库内的文件或数据来释放存储空间。
操作步骤:
在知识库页面,找到目标知识库,单击卡片上的
,再单击编辑。根据当前版本,在弹出的窗口中选择相应操作:
标准版:选择升级。
旗舰版:选择降级或变更RCU数量。
按照界面提示完成操作,单击确定保存后配置即时生效。
命中测试
命中测试用于验证知识库能否为AI应用提供准确的知识输入。通过模拟用户提问,检查知识库的召回结果并调优相似度阈值。
命中测试中的排序模型支持三种模式:问答模式(默认,适合用户提问与文档内容不完全匹配的场景)、相似模式(适合查询与文档内容高度相似的场景)和自定义高级模式。不同模式下,同一查询的排序得分可能存在显著差异(例如,同一切片在问答模式下得分47%,在相似模式下可达69%)。
通过命中测试,可以:
验证知识库能否为AI应用提供有效的知识输入
调优相似度阈值,平衡召回率与准确性
发现知识库中的内容缺失或质量问题
场景示例
场景1:客户咨询产品价格
测试输入:"你们的阿里云百炼手机多少钱?" 期望结果:能够召回包含价格信息的相关文本切片。场景2:技术问题排查
测试输入:"设备连不上WiFi怎么办?" 期望结果:能够召回WiFi连接故障排除的相关文本切片。场景3:视觉理解文档检索(视觉理解知识库)
视觉理解知识库支持纯文字、纯图片和图文组合三种查询模式: 模式1(纯文字):输入"Object Storage Service",召回文档和图片中的相关切片。 模式2(纯图片):上传一张产品截图,系统通过视觉理解匹配语义相近的切片。 模式3(图+文字):同时上传图片并输入描述文字,组合查询可提升召回相似度。场景4:极速问答(极速问答知识库)
极速问答知识库仅支持文本查询(不支持图片输入),适合结构化文档的快速检索: 测试输入:"千问Pro 8的价格是多少?" 期望结果:快速召回包含价格信息的 FAQ 切片。
操作步骤
在知识库页面,找到目标知识库,单击卡片上的命中测试。
在测试界面输入问题(建议收集用户常见问题),观察召回结果。
召回结果:即本次测试的命中结果(已按相似度降序排列),单击任一切片即可查看其具体内容。
图标:若为图片问答类知识库,系统会先将输入图片转为向量并检索相关记录,再将这些记录与提问一起交由大模型生成回答;若为文档搜索、数据查询或音视频搜索类知识库,上传的图片不参与检索;若为使用场景选择「视觉理解」的文档搜索类知识库,上传图片同样参与检索,支持纯文字、纯图片和图文组合三种查询模式,图文组合查询可提升召回相似度。
确认相关文本切片是否被正确召回。如未召回,需调整相似度阈值并重复上一步。
单击查看历史召回记录,可对比不同阈值设置下的历史召回效果。
重排(Rerank)配置
重排(Rerank)功能的开关位置取决于调用知识库的方式,配置错误可能导致排序功能未生效或产生非预期费用。
旧版智能体应用、工作流应用
在应用页面,找到已挂载的知识库,单击其右侧的调试按钮,进入页面后对重排策略开关进行设置。
重要应用内的配置优先级高于知识库本身的配置。
新版智能体应用
在知识库卡片上,单击命中测试;
在选择排序模型处选择不使用模型;
单击保存使配置生效。
新版智能体将知识库作为标准工具调用,配置以知识库自身设置为准。
OpenAPI
控制台:即您在知识库的编辑或命中测试页面所做的配置。
API:相关参数设置,参阅检索知识库。
重要优先级:API参数设置优先级高于控制台页面配置。
日志与监控
知识库的检索调用日志、字段说明、SQL示例与监控边界,详见知识库日志与监控。
配额与限制
关于知识库支持的数据源与容量等信息,请参见知识库配额与限制。
单个阿里云百炼应用可关联的知识库数量:
新版智能体应用(Agent 2.0):
各类型知识库均可无限量关联。
工作流应用 / 旧版智能体应用(Agent 1.0):
文档搜索类:最多5个
数据查询类:最多5个
图片问答类:最多1个
音视频搜索类:最多5个(旧版智能体应用)/ 不支持(工作流应用)
不同类型知识库可同时关联,总数最多为16个(旧版智能体应用)/11个(工作流应用)。
计费说明
知识库采用按量付费(后付费)模式,按小时统计各计费项用量并自动扣费。请保持阿里云账户余额充足(可前往费用与成本充值),避免因欠费导致服务中断。
计费项 | 说明 |
规格费用 | |
向量、排序模型调用费用 | 创建、更新或检索知识库时会调用向量(embedding)和排序(rerank)模型,按输入 Token 用量计费,价格以模型调用计费页为准。 |
账单查询:账单详情
API参考
如需获取最新完整的知识库API列表及输入输出参数,请参见API 目录(知识库)。
如需了解相关API的具体用法和代码示例,请参见知识库API指南。
常见问题
构建知识库
处理图片及多模态内容
权限与安全
迁移与导出
更多
场景教程
通过阿里云百炼快速构建在线知识库问答应用,实现全天候(7 × 24)响应用户咨询,提升用户体验与业务竞争力:











图标,确认后即可将数据表的最新内容同步至知识库。






