文档

如何快速调用知识检索增强能力

更新时间:
一键部署

本篇说明如何快速调用检索增强能力。

定义

阿里云百炼提供检索增强能力可以帮助大家实现让大模型瞬间“开挂”的技能。结合上传的知识数据,大模型识别解析学习文档内容,最终给出生成式回复。我们在通义千问大模型的基础上,将文件上传、读取、切片、向量化等过程都开发好预置在应用中,实现开箱即用,更能满足您的日常需求。

优势

开箱即用:预置检索增强流程/prompt模板应用,无需开发,业务人员也可开箱即用。

智能问答:支持上传企业知识,与大模型能力结合,用于企业特定知识领域的问答。

灵活易接入:满足企业快捷接入结构化&非结构化数据,支持多种文件格式。

配置知识库

我们在使用检索增强应用时,需要先将知识库搭建完成,才能使应用进行检索。

上传数据

  1. 选择数据管理--点击导入数据,选择导入方式,目前支持本地上传和OSS上传文件,然后点击确认。

说明

支持PDF、doc、docx格式,单次最多上传20个文件,且单个文件最多100M或1000页。

image

image

  1. 等待文件状态更新为导入成功。

image

image

  1. 创建知识库,并将上传的文件导入知识库中,并点击导入完成。

image

image

image

  1. 导入完成后,新建的知识库中已存在上传的文档数据。image

以上就是我们知识库的搭建以及上传数据的内容。下面我们将介绍如何让大模型检索我们上传的文档。

开启检索增强

  1. 进入阿里云百炼控制台,点击我的应用--创建应用--选择模型并进行参数配置。

说明

参数配置说明

温度系数:调控生成的多样性。

最长回复长度:模型生成的长度限制,不包含prompt。允许的最大长度因模型不同有所改变。

携带上下文轮数:设置输入模型的最大历史对话轮数,轮数越多,对话相关性越强。

imageimage

  1. 输入prompt并进行优化,根据情况进行采纳。

说明

prompt:可以用来为模型授予角色和技能。

prompt优化:针对输入的prompt进行专业优化,使模型更容易理解指令。

image

  1. 开启知识检索增强按钮并选择知识库。若无知识库可以点击新建知识库,按照提示创建。

image

说明

知识检索增强:在通义千问大模型的基础上,专项增强「基于知识检索的大模型生成能力」,支持基于结构化/非结构化内容的文字生成场景。

收费标准:选择哪个模型就按照哪个模型计费,点击产品计费查看说明。

  1. 创建完成的应用可以在【我的应用】列表中查看。

image

管理应用

点击应用下方的【管理】按钮,返回我们刚开始创建应用的页面,在这个页面您可以修改应用配置,包括开启/关闭知识检索增强、检索片段数设置、长期记忆开启/关闭、选择插件、高级配置等。页面右侧为应用测试窗,可以进行内容测试。也可在左上角查看应用API和API KEY。

image

选择插件

插件是应用中重要的一环,结合增强大语言模型的规划调度能力和生成能力,更好地在您的业务场景中落地。我们提供两类插件:官方插件和自定义插件image

官方插件名称

插件说明

收费情况

图片生成

接入图片生成插件使通义千问大模型拥有良好的文生成图、图文生图的能力。

限时免费,需申请开通

夸克搜索

接入夸克搜索插件来查找公开的网络知识和信息,增强大模型对实时信息的获取能力。该插件能力由夸克团队提供。

限时免费,需申请开通

Python代码解释器

接入代码解释器插件使通义千问大模型拥有执行Python代码的能力,可用于数学计算、数据分析与可视化、数据处理等任务。

免费

计算器

接入计算器插件使通义千问大模型拥有良好的计算能力,可用于教育等应用场景。

免费

高级配置—快速干预

快速干预可以快速处理用户输入的违规话术。

创建干预话术规则

  • 规则名称:支持中英文、数字,最多支持20个字符。

  • 规则条件:默认为空,点击“新增条件”按钮,选择所需的条件类型。

    • 注意:干预输入话术支持关键词、正则表达式、语义意图三种类型。

    • 干预生成结果仅支持关键词一种类型。

    • 关键词:新建条件后,默认为“包含”,最多支持输入50个关键词

    • 正则表达式:新建条件后,默认为“包含”,最多支持输入10个表达式;配置方法参考正则表达式配置

    • 语义意图:新建条件后,默认为“包含”,最多支持输入10个相似语句

  • 回复话术:支持干预回复内容,并调整为回复话术,支持中英文、数字,最多支持500字符。

  • 规则新建完成默认为“已禁用”状态,需要用户手动开启该规则。

image

高级配置—对话记录管理

通过内置缓存支持多轮对话:使用平台内置缓存,可实现大模型应用的多轮会话。开启后,可在测试窗或API调用中通过传入SessionID实现多轮会话。

通过ADB-PG备份会话记录:内置缓存的数据默认不会落盘存储,只在内存中存储1小时。打开此开关并选择已购买的ADB-PG实例,可自动将此应用的对话记录存储到对应的ADB-PG实例中。

image

应用调用

选择应用下方的调用按钮,页面跳转到API接口文档,按照文档内容进行调试和调用即可。

image

以上就是检索增强能力的完整使用步骤,快来一起练习参与讨论吧。

  • 本页导读 (1)