本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。
大模型缺乏私有知识,且通用知识更新滞后。业界通常采用检索增强生成(RAG)技术,根据用户输入从外部信息源检索相关信息,然后将检索到的内容整合到用户输入中,从而帮助大模型生成更准确的回答。知识库功能作为阿里云百炼的RAG能力,能有效补充私有知识并提供最新信息。
无专属知识库的应用 在没有专属知识库时,大模型无法准确回答特定领域的问题。 | 有专属知识库的应用 引入专有知识库后,大模型就能准确回答特定领域的问题。 |
支持的模型
以下模型可使用知识库。配置通义千问使用知识库教程
预置模型(阿里云百炼支持的标准模型) | 自定义模型(在阿里云百炼调优后的模型) |
| 指基于以下模型调优后的自定义模型。
|
上述列表可能随时更新。请以在应用管理页面创建应用时实际可选的模型为准。
工作原理
通过知识库,大模型能够对您的私有数据或文件进行语义检索,从中找出语义相同或相近的结果,即使关键词匹配度较低甚至为零。
更多知识库工作原理等详细信息,请参见阿里云大模型ACA课程的检索增强生成。
快速开始
本节介绍如何零代码构建一个能回答特定领域问题(关于“阿里云百炼手机”)的大模型问答应用。
1. 构建知识库
进入知识库页面,点击创建知识库。填写知识库名称,其他设置可保持默认,点击下一步。
选择默认类目,上传阿里云百炼系列手机产品介绍.docx文件。点击下一步,然后点击导入完成。
2. 集成到业务应用
知识库创建后,即可将其与具体的阿里云百炼应用(须与知识库在同一业务空间下)或外部应用关联,处理检索请求。
集成到智能体应用
进入应用管理页面,找到目标智能体应用,并点击卡片上的配置。随后,为应用选择一个模型。
点击页面上文档右侧的+按钮,添加在上一步中构建好的知识库。相似度阈值和权重可保持默认。
在页面右侧的输入框中发起提问,大模型将使用构建的知识库进行回答。
例如:“请你帮我挑选一款拍照效果最好的阿里云百炼手机,价格在3000元以内。”
集成到工作流应用
进入应用管理页面,找到目标工作流应用,并点击卡片上的配置。随后,将一个知识库节点拖入画布,并将其连接在开始节点之后。
配置知识库节点:
输入:在变量名
content
右侧的值下拉列表中选择 。选择知识库:选择在上一步中构建好的知识库。
设置TopK(可选):它决定了返回给下游节点(通常是大模型节点)的知识“数量”。
增大该值通常会提升大模型回答的准确性,但也会相应增加大模型的输入Token消耗。
将一个大模型节点拖入画布,并将其连接在知识库节点之后,结束节点之前。
配置大模型节点:
在模型配置列表中,为节点选择一个模型。
在提示词中,输入让大模型使用知识库的指令。
需输入“/”以插入
result
变量(表示知识库检索返回的结果)。
配置结束节点:输入
/
,随后选择 ,输出大模型返回的结果。点击页面右上角的测试,随后在页面右侧的输入框中发起提问,大模型将使用构建的知识库进行回答。
例如:“请你帮我挑选一款拍照效果最好的阿里云百炼手机,价格在3000元以内。”
集成到外部应用
除了在阿里云百炼构建应用,知识库的检索能力还可作为一项独立的RAG服务,通过阿里云百炼SDK快速接入到外部AI应用中。
具体集成方案等详细信息,请参见知识库API指南的检索知识库章节。
3. 优化知识库效果(可选)
在问答过程中,如遇到知识召回不完整或内容不准确的问题,请参考知识库效果优化。
操作指南
知识库ID:将鼠标悬浮于知识库旁图标上即可显示当前知识库ID。
创建知识库
进入知识库页面,点击创建知识库。
根据应用场景,选择合适的知识库类型(单一知识库无法同时支持多个类型)。创建后,知识库类型不可更改。
文档(检索场景)
适用场景:
适用于企业内部文档、产品手册等非结构化数据(未按某个预定义的表结构组织的数据,含文本、表格和图片)的检索。
若文件包含图片,且需阿里云百炼应用在回答中返回,请选择文档。
数据源接入:支持本地上传文件,或从阿里云对象存储OSS导入。
数据(Chatbot/NL2SQL场景)
适用场景:
适合构建基于结构化数据(按某个预定义的表结构组织的数据)的问答系统,例如FAQ/商品数据/人员信息查询助手。
若数据为完整的FAQ问答对,请选择数据。例如Excel文件包含两列,分别为
问题
和答案
。数据类知识库允许限定问题
列用于知识库检索,答案
列用于大模型回答参考。文件搜索类知识库难以实现此效果。
导入多个Excel文件,且它们的表结构完全一致。
数据源接入:支持从本地上传XLS或XLSX文件,或从阿里云数据库RDS导入数据。
图片(图搜场景)
适用场景:
适合构建以图搜图、以图搜“图+文字”的多模态检索应用,如商品导购/视觉问答助手。
数据源接入:支持从本地上传XLS或XLSX文件(需包含图片URL链接),或从阿里云数据库RDS导入数据。
在请求高峰时段,整个创建过程可能需要数小时(取决于数据量大小),请耐心等待。
更新知识库
知识库内容的任何变更都会实时同步到所有引用它的应用中。
文档类知识库
自动更新(推荐)
使用对象存储OSS管理文件,通过函数计算FC监听文件变更事件,自动同步更新至知识库,实现知识的实时更新。详见告别手动操作,让AI知识库自动更新。
手动更新
进入知识库页面,单击目标知识库右侧的查看。
如何新增文件:单击导入数据,勾选应用数据中的已有文件。如何上传文件至应用数据
如何删除文件:找到目标文件后,单击其右侧的删除。
此操作仅将文件从知识库中移除,不会删除应用数据中的源文件。
如何修改文件内容:先删除文件(旧版本),再新增文件(新版本)即可。
注意:若保留旧版本文件可能导致过时内容被检索和召回。
数据/图片类知识库
自动更新(推荐)
使用阿里云关系型数据库RDS或自建MySQL管理知识数据,可实现知识库的自动同步更新(延迟通常为分钟级,在请求高峰期可能为小时级),详见集成MySQL数据至知识库。
手动更新
当知识库的数据源是应用数据中的数据表时,只能手动更新,流程分为两步。
步骤一:更新数据表
访问表格页签。左侧列表中选择目标数据表,单击导入数据。
如何插入新数据:导入类型选择增量上传。需上传一个仅包含表头和新增数据行的Excel文件。
文件的表头须与当前表结构一致。可使用页面上的下载模板功能,获取标准表头文件,直接在该文件中填入新数据。
如何删除数据:导入类型选择覆盖上传。需上传一个包含表头及最新完整数据(已移除需删除的记录)的Excel文件。
如何获取全量数据:单击页面上的
下载XLSX格式数据。
如何修改数据:导入类型选择覆盖上传。需上传一个包含表头及最新完整数据(已包含相应的修改)的Excel文件。
步骤二:变更同步知识库
返回知识库列表,单击目标知识库右侧的查看。单击数据表左上方的
图标,确认后即可将数据表的最新内容同步到知识库。
后续每次更新后,需手动重复以上步骤(应用数据无自动同步功能)。
编辑知识库
知识库创建后,仅支持修改其基本信息及相似度阈值,其他配置不可变更。当前不支持通过API操作。
删除知识库
当知识库已不再被任何应用使用时,可将其永久删除。
本操作不会删除应用数据中的源文件/数据表。
删除操作不可逆,请谨慎操作。
配额与限制
关于知识库支持的数据源与容量等信息,请参见知识库配额与限制。
每个阿里云百炼应用最多可关联5个知识库。
计费说明
知识库功能本身不收费,但在调用引用了知识库的阿里云百炼应用时,可能会产生费用。
步骤 | 计费情况 | |
不收费。 | ||
调用阿里云百炼应用时,从知识库召回的文本切片会增加大模型输入Token数量,这可能导致模型推理(调用)费用的增加。关于模型推理(调用)的费用详情,请参见计费项与定价。 注意:如果仅在指定的知识库中进行检索(通过调用Retrieve接口的方式),则不产生费用。 | ||
不收费。 |
API参考
请参见API目录(知识库)获取最新完整的知识库API列表及输入输出参数。具体使用方法和代码示例,请参阅知识库API指南。
常见问题
构建知识库
处理图片及多模态内容
权限与安全
迁移与导出
更多
场景教程
使用阿里云百炼快速构建一个在线知识库问答应用,以便全天候(7 × 24)响应用户咨询,提升用户体验、增强业务竞争力: