为了提供更强大、更灵活的知识增强能力,Prompt 样例库将由功能更全面的RAG 表格库取代。本文档将指导您完成从 Prompt 样例库到 RAG 表格库的整个迁移过程。
工作流程
整个过程包含四个主要步骤:
-
导出数据:从样例库中将数据导出到本地。
-
创建与导入:创建新的 RAG 表格库,并将导出的文件导入。
-
更新应用配置:在智能体应用中添加 RAG 表格库知识。
-
验证与发布:调试并测试问答效果,发布应用。
如何使用
步骤 1:导出样例库数据
访问样例库页面,选择需要迁移的样例库,点击导出数据,数据表将被保存到本地。
步骤 2:创建 RAG 表格库并导入数据
相关文档:创建和使用知识库。
-
填写基础信息
访问知识库页面,创建数据查询类型的知识库:
在知识库名称中填写名称,知识库类型选择数据查询,单击下一步。
-
导入数据
上传步骤一中导出到本地的数据表,填写名称信息。
选择上传数据表页签,在数据表名称中输入
知识内容表,完成文件上传后单击下一步。 -
索引设置
-
为了达到与旧版样例库最接近的检索效果(即仅基于问题列进行匹配),可关闭
answer字段的参与检索开关。 -
确认配置无误后,点击完成。
默认配置中,多轮对话改写为开启状态,向量模型选择官方向量v4(新版),排序模型选择官方排序,相似度阈值设为
0.20,最大召回数量设为5。 -
步骤 3:更新智能体配置
-
在应用内关闭样例库开关,移除提示词中的样例库变量。
-
点击表格处右侧的加号,添加上一步创建的 RAG 表格库。在知识配置面板的表格区域,单击 + 添加表格类知识库(如"技术知识内容"),可配置相似度阈值和权重等参数。
-
(可选)优化检索策略。点击调试,可根据业务需求修改策略调整召回流程,在右侧输入问题进行调试。
如果对响应时长有要求,可取消选中多轮对话改写、关闭重排策略,并调整拼装策略。
拼装策略区域可选择按召回数量,并通过召回片段数和最大拼装长度(token)滑块调整参数。
步骤 4:测试与发布
在右侧的调试窗口中,输入一个与表格库相关的内容进行测试,确认模型能够检索召回 RAG 表格库内容进行回答。
测试通过后发布应用,使配置变更在线上生效。
API调用
在调用应用时,将请求参数 has_thoughts 设置为 true,响应中的 thoughts 字段将包含详细的检索过程信息,便于调试和验证。
调用示例可参考应用调用-检索知识库。
计费说明
知识库采用按量付费(后付费),按小时统计下方计费项的用量,并从您的阿里云账户自动扣费。请确保账户余额充足(可前往费用与成本充值),以免因欠费导致服务中断。
|
计费项 |
说明 |
|
规格费用 |
|
|
向量、排序模型调用费用 |
创建、更新或检索知识库时会调用向量(embedding)、排序(rerank)模型,会产生费用。按输入 Token 用量计费,价格以模型调用计费页为准。 |
账单查询:账单详情
常见问题
-
为什么要迁移到 RAG 表格库?
容量和格式:RAG 表格库无数量上限,不再局限于样例库的 300 条问答。
检索召回:样例库不支持设置召回策略。而RAG 表格库可实现样例库功能,且可配置检索召回策略,可满足更加丰富的使用场景。
-
迁移到 RAG 表格库后,模型的回答效果会和之前一样吗?
通常会更好。RAG 表格库采用了检索算法,并提供了丰富的配置选项。可以通过调试来调整 RAG 表格库的检索配置,以达到最佳效果。