智能体应用

更新时间:
复制为 MD 格式

大语言模型(LLM)无法直接访问私有知识库或获取实时信息。阿里云百炼智能体(Agent)应用支持以零代码方式将大模型与外部工具和知识库连接,突破模型内置能力的边界。

工作原理

智能体由提示词驱动,通过协调外部能力完成复杂任务。接收到请求后,大模型识别用户意图并规划任务,随后自主调用外部工具,最终整合结果生成回复。

适合使用智能体的场景:希望模型根据可用工具自主决策如何处理任务,而不是手动设计多步骤工作流。例如,构建一个客服助手,能自动查询私有知识库、调用实时数据 API,并将结果汇总成完整回复。

百炼智能体支持以下核心能力:

  1. 知识库(RAG):连接外部知识库,基于私有数据回答问题。适用于模型内置知识无法覆盖的垂直领域问答场景。

  2. 插件:调用平台预置工具,如代码执行、图像生成、天气查询等。适用于需要执行对话之外的具体操作时。

快速开始

创建基础智能体

智能体能力

通过选择模型、优化系统提示词、添加知识库(RAG)和调用插件来扩展智能体能力。

模型

模型是驱动智能体进行推理和决策的核心。百炼智能体支持千问系列模型和自定义部署模型。

系统提示词

系统提示词定义智能体的角色、行为方式和能力边界,确保回复保持一致性和任务导向。编写有效提示词时,可参考以下要点:

  • 定义角色:说明模型应扮演的角色及应具备的专业知识。

  • 指定输出格式:描述期望的内容结构、长度或风格。

  • 设置约束条件:告知模型应避免哪些内容或需遵守哪些规则。

  • 引导工具使用:明确提及工具名称,并说明何时使用。

    1. 配置提示词

      将系统提示词设置为请你模仿《百年孤独》的风格来回答我的问题,效果对比如下:

      • 未配置系统提示词:

        image

      • 配置系统提示词后:

        image

知识库(RAG)

检索增强生成(RAG)使智能体能够查询外部知识库,并以检索到的内容作为生成答案的依据。对于私有知识或垂直领域问答,RAG 可显著提升回答准确率,减少幻觉问题。详情参见创建和使用知识库

说明:从知识库中检索到的文本会占用模型的上下文窗口。需根据实际情况调整检索策略和文本长度,以充分利用上下文窗口并避免超限。

插件

智能体通过调用插件,完成代码执行、网络搜索、文本生成图片等具体任务。插件适用于需要执行超出内置知识范围的操作或内容生成时。百炼提供多种官方插件,同时支持添加自定义插件,详情参见插件概述

智能体交互

文本对话

文本对话是智能体的主要交互方式,支持多轮对话。

文本对话支持两种输入方式:

  1. 文本输入: 输入文字与智能体对话。

  2. 文件上传: 上传文档、图片、视频、音频等格式的文件作为附件。

发布与调用

百炼智能体支持通过API调用,也支持一键发布到第三方平台,或通过组件集成到业务流程中。

发布应用

重要

发布应用是后续调用和集成的前提条件。

单击智能体应用管理界面右上角的发布,再单击确认发布,即可完成发布。

若非首次发布,弹窗会展示自上次发布以来的变更详情。
说明

如果应用由RAM账号创建,发布前请确认已拥有服务关联角色权限 ram:CreateServiceLinkedRole,详情参见服务关联角色

API 调用

在智能体应用的发布渠道页签,单击API调用右侧的查看API,查看API调用方法。

将替换为实际的百炼API Key 后方可发起调用。

image

智能体管理

复制与删除

应用管理页面找到应用卡片,通过更多 > 复制应用/删除应用菜单,对智能体进行复制、删除或重命名操作。

image

适合复制应用的场景:

  • 使用不同提示词或模型创建测试版本

  • 针对不同受众或用途定制智能体

  • 在进行重大配置变更前创建备份

版本管理

版本管理支持编辑历史版本描述,或回滚至已发布的历史版本。

  1. 在智能体应用的配置页签,单击顶部导航栏右侧的版本管理image

  2. 在历史版本列表中,选中目标版本后:image

    • 如需修改版本信息,将鼠标悬浮至image图标处单击,在编辑版本描述对话框中完成修改后,单击确定

    • 如需使用该历史版本,单击覆盖当前草稿,在二次确认对话框中单击确认

      该历史版本内容将覆盖当前版本草稿。

计费说明

智能体计费涉及以下几个方面:

  1. 模型调用

    智能体会产生模型调用费用,具体取决于模型类型和 Token 用量。

    计费详情参见百炼控制台

  2. 知识库

    • 从知识库检索的文本切片会增加模型输入 Token 数量,可能导致模型调用费用增加。

  3. MCP

    • 部分官方 MCP 按模型调用计费,例如文生图、文生视频、语音合成等 MCP。

    • 部分 MCP 服务涉及第三方API调用,使用后可能产生费用,该费用由第三方收取,百炼不另行收费。

  4. 长期记忆

    • 长期记忆的数据存储不收费。

    • 问答调用时,记忆体内容会合并到 Prompt 中传递给大模型,从而增加 Token 消耗。记忆体内容占用的 Token 暂不计费。

支持的模型

说明

数据更新可能存在延迟,模型支持情况以智能体应用内显示为准。

常见问题

百炼应用如何计费?

仅创建应用不收费。调用应用进行问答时,根据所用模型类型收取模型调用费用。

配置了知识库,但智能体的回答与知识库内容无关,如何解决?

先进行知识库命中测试,查看问题与知识库内容的相似度得分。得分较低时,调整检索配置,确保模型优先从知识库获取答案。

在提示词中明确要求模型仅基于知识库内容回答,避免使用模型自身知识。如果问题仍未解决,可尝试更换其他模型以获得更稳定的输出。

自定义插件是否有超时限制?

有,超时限制为 5 秒。

是否支持通过API创建智能体应用?

支持使用 Assistant API创建功能类似于智能体应用的大模型应用。但 Assistant API创建的应用不支持控制台管理,详情参见Assistant API文档