智能体应用-大模型服务平台百炼(Model Studio)-阿里云帮助中心

工作原理

智能体由提示词驱动，通过协调外部能力完成复杂任务。接收到请求后，大模型识别用户意图并规划任务，随后自主调用外部工具，最终整合结果生成回复。

适合使用智能体的场景：希望模型根据可用工具自主决策如何处理任务，而不是手动设计多步骤工作流。例如，构建一个客服助手，能自动查询私有知识库、调用实时数据 API，并将结果汇总成完整回复。

百炼智能体支持以下核心能力：

知识库（RAG）：连接外部知识库，基于私有数据回答问题。适用于模型内置知识无法覆盖的垂直领域问答场景。
插件：调用平台预置工具，如代码执行、图像生成、天气查询等。适用于需要执行对话之外的具体操作时。

快速开始

创建基础智能体

智能体能力

通过选择模型、优化系统提示词、添加知识库（RAG）和调用插件来扩展智能体能力。

模型

模型是驱动智能体进行推理和决策的核心。百炼智能体支持千问系列模型和自定义部署模型。

系统提示词

系统提示词定义智能体的角色、行为方式和能力边界，确保回复保持一致性和任务导向。编写有效提示词时，可参考以下要点：

定义角色：说明模型应扮演的角色及应具备的专业知识。
指定输出格式：描述期望的内容结构、长度或风格。
设置约束条件：告知模型应避免哪些内容或需遵守哪些规则。
引导工具使用：明确提及工具名称，并说明何时使用。
1. 配置提示词
  
  将系统提示词设置为请你模仿《百年孤独》的风格来回答我的问题，效果对比如下：
  - 用户发送"你是谁"，模型以默认身份回复自我介绍："我是通义千问（Qwen），由阿里巴巴集团旗下的通义实验室自主研发的超大规模语言模型。我可以帮助你回答问题、提供信息、进行创作、编程、逻辑推理等。"
  - 在文本对话界面中，用户发送"你是谁"，AI 以《百年孤独》文学风格进行自我介绍，引用马孔多、布恩迪亚家族等小说元素，表明系统提示词已生效。底部显示统计信息：字数 234、输入 token 245、输出 token 177。

知识库（RAG）

检索增强生成（RAG）使智能体能够查询外部知识库，并以检索到的内容作为生成答案的依据。对于私有知识或垂直领域问答，RAG 可显著提升回答准确率，减少幻觉问题。详情参见创建和使用知识库。

说明：从知识库中检索到的文本会占用模型的上下文窗口。需根据实际情况调整检索策略和文本长度，以充分利用上下文窗口并避免超限。

插件

智能体通过调用插件，完成代码执行、网络搜索、文本生成图片等具体任务。插件适用于需要执行超出内置知识范围的操作或内容生成时。百炼提供多种官方插件，同时支持添加自定义插件，详情参见插件概述。

智能体交互

文本对话

文本对话是智能体的主要交互方式，支持多轮对话。

文本对话支持两种输入方式：

文本输入： 输入文字与智能体对话。
文件上传： 上传文档、图片、视频、音频等格式的文件作为附件。

发布与调用

百炼智能体支持通过API调用，也支持一键发布到第三方平台，或通过组件集成到业务流程中。

发布应用

重要

发布应用是后续调用和集成的前提条件。

单击智能体应用管理界面右上角的发布，再单击确认发布，即可完成发布。

若非首次发布，弹窗会展示自上次发布以来的变更详情。

说明

如果应用由RAM账号创建，发布前请确认已拥有服务关联角色权限 ram:CreateServiceLinkedRole，详情参见服务关联角色。

API 调用

在智能体应用的发布渠道页签，单击API调用右侧的查看API，查看API调用方法。

将替换为实际的百炼API Key 后方可发起调用。

智能体管理

复制与删除

在应用管理页面找到应用卡片，通过更多菜单，对智能体进行复制、删除或重命名操作。

适合复制应用的场景：

使用不同提示词或模型创建测试版本
针对不同受众或用途定制智能体
在进行重大配置变更前创建备份

版本管理

版本管理支持编辑历史版本描述，或回滚至已发布的历史版本。

在智能体应用的配置页签，单击顶部导航栏右侧的版本管理。
在历史版本列表中，选中目标版本后：打开 历史版本 面板，面板以时间线形式展示 当前草稿、线上版本（带最新标签）及各历史版本条目，每个版本显示版本ID、发布时间、发布人和版本信息。
- 如需修改版本信息，将鼠标悬浮至图标处单击，在编辑版本描述对话框中完成修改后，单击确定。
- 如需使用该历史版本，单击覆盖当前草稿，在二次确认对话框中单击确认。
  
  该历史版本内容将覆盖当前版本草稿。

计费说明

智能体计费涉及以下几个方面：

模型调用

智能体会产生模型调用费用，具体取决于模型类型和 Token 用量。

计费详情参见百炼控制台。
知识库
- 从知识库检索的文本切片会增加模型输入 Token 数量，可能导致模型调用费用增加。
MCP
- 部分官方 MCP 按模型调用计费，例如文生图、文生视频、语音合成等 MCP。
- 部分 MCP 服务涉及第三方API调用，使用后可能产生费用，该费用由第三方收取，百炼不另行收费。
长期记忆
- 长期记忆的数据存储不收费。
- 问答调用时，记忆体内容会合并到 Prompt 中传递给大模型，从而增加 Token 消耗。记忆体内容占用的 Token 暂不计费。

支持的模型

说明

数据更新可能存在延迟，模型支持情况以智能体应用内显示为准。

常见问题

百炼应用如何计费？

仅创建应用不收费。调用应用进行问答时，根据所用模型类型收取模型调用费用。

配置了知识库，但智能体的回答与知识库内容无关，如何解决？

先进行知识库命中测试，查看问题与知识库内容的相似度得分。得分较低时，调整检索配置，确保模型优先从知识库获取答案。

在提示词中明确要求模型仅基于知识库内容回答，避免使用模型自身知识。如果问题仍未解决，可尝试更换其他模型以获得更稳定的输出。

自定义插件是否有超时限制？

有，超时限制为 5 秒。

是否支持通过API创建智能体应用？

支持使用 Assistant API创建功能类似于智能体应用的大模型应用。但 Assistant API创建的应用不支持控制台管理，详情参见Assistant API文档。