智能体应用_大模型服务平台百炼(Model Studio)-阿里云帮助中心

您可以在百炼控制台以零代码的方式快速创建智能体应用，并将RAG（Retrieval-Augmented Generation，检索增强生成）以及插件能力集成进来。应用创建完成后，您可以通过控制台或API的方式来使用。

为什么使用智能体应用

大模型具有强大的语言理解和生成能力，然而大模型有一定局限性，如：

无法回答私有领域问题，如公司制度、人员信息等；
无法及时获取最新消息，如实时天气、比赛结果等；
无法准确回答专业问题，如数学计算、图像生成等。

您可以使用智能体应用来解决这些问题。智能体应用是以大模型为基础，根据业务场景集成特定外部能力的应用。

此处外部能力含义为：大模型本身不具备的能力。如获取实时信息、回答私有领域问题等。

您可以在百炼控制台通过零代码的方式创建智能体应用，并将外部能力集成到应用中，解决您的业务问题。

智能体应用有许多使用场景，如：

私有领域知识问答
您只需准备好知识库文件，便可以在百炼控制台快速创建一个私有领域知识问答应用，将其应用到如公司制度、人员信息等问答场景。
个性化聊天机器人
百炼提供了长期记忆功能，可以保存关键的历史对话信息，为您提供个性化的聊天体验。此外，百炼集成了夸克搜索和图像生成等插件，可以扩展聊天机器人的功能。
智能助手
通过引入RAG能力、长期记忆以及自定义插件等能力，您可以构建一个智能助手，帮助您提升工作效率，如处理邮件、撰写周报等。

应用类型

百炼支持普通智能体应用和RAG智能体应用。两种应用的功能完全相同，仅针对使用场景优化了用户界面。

如果您需要智能体回答私有知识问题，建议使用 RAG 智能体应用。如果您不确定具体的使用场景，建议使用普通智能体应用。

普通智能体应用	RAG智能体应用

普通智能体应用

RAG智能体应用

适用于各类任务的用户界面

默认不启用扩展功能

针对“私有知识问答”优化的用户界面

默认已启用“知识检索增强”功能

支持的模型

说明

数据更新可能存在延迟，模型的支持情况以智能体应用内显示为准。

模型系列	模型名称

模型系列	模型名称
通义千问	通义千问-Max 通义千问-Max-Latest 通义千问-Max-2024-09-19 通义千问-Plus 通义千问-Plus-Latest 通义千问-Plus-2025-01-25 通义千问-Plus-2024-07-23 通义千问-Plus-2024-08-06 通义千问-Plus-2024-09-19 通义千问-Plus-2024-11-25 通义千问-Plus-2024-11-27 通义千问-Plus-2024-12-20 通义千问-Plus-2025-01-12 通义千问-Turbo 通义千问-Turbo-Latest 通义千问-Turbo-2024-09-19 通义千问-Turbo-2024-06-24
通义千问VL	通义千问VL-Plus-Latest 通义千问VL-Plus-2025-01-25 通义千问VL-Max 通义千问VL-Max-Latest 通义千问VL-Max-2024-10-30 通义千问VL-Max-2024-11-19 通义千问VL-Max-2024-12-30 通义千问VL-Plus-2024-08-09 通义千问VL-Plus-2025-01-02
通义千问2.5 开源	通义千问2.5-14B-1M 通义千问2.5-72B 通义千问2.5-32B 通义千问2.5-14B 通义千问2.5-3B 通义千问2.5-1.5B 通义千问2.5-0.5B 通义千问2.5-7B
通义千问2 开源	通义千问2-72B 通义千问2-57B 通义千问2-7B
DeepSeek	DeepSeek-V3 DeepSeek-R1 DeepSeek-R1-Distill-Qwen-32B DeepSeek-R1-Distill-Qwen-14B DeepSeek-R1-Distill-Qwen-7B
通义法睿	通义法睿-Plus-32K
通义千问-Long	Qwen-Long
Llama	Llama-3.1-405B-Instruct Llama-3.1-70B-Instruct Llama-3.1-8B-Instruct
零一万物	Yi-Large
MiniMax	MiniMax abab6.5s-245k

步骤一：创建智能体应用

1. 创建应用

访问百炼控制台我的应用，单击新增应用，在智能体应用页签，单击直接创建。

如果您之前已创建过应用，则单击右上角的新增应用。

2. 选择大模型并配置参数

进入智能体应用管理界面后，您需要进行大模型的选择与参数配置。您可以参考右图，单击设置，并在模型选择的下拉菜单中选择模型，此处选择通义千问-Max。您可以根据需求进行模型参数的配置，参数详情请将鼠标移动到进行查看，若无特定需求保持默认即可。

说明

DeepSeek-R1 系列模型暂不支持设置温度系数。

3. 测试应用

选择大模型之后，您就在百炼创建完成了一个智能体应用。您可以输入问题进行测试。

步骤二：拓展智能体应用的能力

您可以在智能体应用管理界面，通过设置Prompt、添加RAG与插件等方法拓展智能体应用的能力。

系统提示词（System Prompt）：指引内容生成方向

您可以在智能体应用管理界面中输入Prompt来指引应用生成内容的方向。例如设置Prompt为：

请你模仿李白的语气。

输入“你好”，智能体应用的输出如右图。

说明

针对 DeepSeek R1 系列模型，DeepSeek官方不建议设置系统提示词，原文如下："Avoid adding a system prompt; all instructions should be contained within the user prompt."

知识检索增强（RAG）：提升私域知识问答能力

RAG (Retrieval-Augmented Generation) 是一种检索技术，它通过自动检索相关文档内容，并将这些信息作为上下文输入给智能体，从而提高智能体的回复准确率。特别是在处理私有知识或垂直领域问答时，RAG能显著提升智能体的效果。

提示： RAG 检索到的文本也会占用大模型的上下文窗口长度（Context Window），因此需要根据实际情况调整检索策略和文本长度，以充分利用上下文窗口并避免超出限制。

1. 上传数据

访问数据管理，单击导入数据。此处选择百炼系列手机产品介绍.docx作为知识库文件。在导入数据界面，将文件通过本地上传方式导入。

2. 创建知识库

访问知识库索引，单击创建知识库。在创建知识库界面填入知识库名称与知识库描述，此处设置知识库名称为：百炼手机产品介绍，知识库描述为：本知识库包含百炼手机产品的详细介绍。其它保持默认选项即可，单击下一步。
单击选择文件，类目位置单击默认类目，文件名称选择百炼系列手机产品介绍。单击下一步。
数据处理，使用默认的智能切分。单击导入完成。
当状态为解析完成时，表示知识库创建完毕。

3. 在应用中集成RAG

访问我的应用，单击已创建应用卡片的管理按钮，进入智能体应用管理界面。单击知识库检索增强按钮，Prompt中会自动填入让大模型参考知识库的指令。单击配置知识库，然后从列表中选择百炼手机产品介绍，其它选项保持默认即可。
向输入框输入问题：
我喜欢打游戏，推荐哪款手机？
从右图可以看到，在集成了RAG能力后，智能体应用可以根据上传的知识库文件来回答问题。
当智能体应用关联结构化知识库时，支持在提问时上传图片。此时，如果知识库中存在图片索引，系统会先将输入图片转为向量并检索到相关记录，然后将这些记录与提问一起提供给大模型；如果不存在图片索引，则输入的图片不会用于检索。
智能体应用目前仅支持生成文本内容。
检索配置（可选）：
如果您需要配置片段拼装策略、设置知识范围或展示回答来源，您可以进一步修改检索配置。

插件：接入联网搜索、代码执行等更多效率工具

插件可以使智能体应用更高效、更专业地应用到业务场景中。百炼提供了多种官方插件。您可以在智能体应用管理界面单击选择插件，便可以在插件广场栏中选择一个或多个插件。

同时您也可以添加自定义插件，详情请查看插件概述。

说明

DeepSeek 系列模型暂不支持插件，包括“夸克搜索”在内的联网搜索插件目前无法使用。

1. 添加插件

此处以图片生成插件为例，选择对应插件后，单击确认。

2. 测试插件效果

添加插件后，向输入框输入：

画一只猫。

智能体应用的回复如右图，可以看到智能体应用调用了图像生成插件（即text_to_image）。

3. 使用更多插件

您可以在同一个智能体应用中选择最多10个插件。智能体应用会根据输入选择使用一个或多个插件。比如提问：

查一下杭州明天的天气，并将这个天气的西湖画出来。

智能体应用会输出如右图的内容。

长期记忆：保存个性化信息

智能体应用具备短期对话记忆能力，但受限于大模型注意力机制，可能无法长时间保持上下文连贯性。 长期记忆功能允许大模型自动存储个性化信息，确保智能体应用在后续对话中能够持续调用和参考这些信息，提升对话的个性化和连贯性。

详细的功能介绍请参考长期记忆文档。

1. 开启长期记忆在智能体应用编辑界面，开启长期记忆功能开关。
2. 配置用户画像点击记忆变量配置，添加新的记忆变量字段，点击右上角发布应用。字段是记忆变量的属性，例如“岗位”、“行业”、“兴趣爱好”等。字段描述用于解释字段名称，帮助大模型更好地理解字段的含义。是否通过模型推理控制该字段是否参与模型推理。开启后，系统会根据对话内容自动推理和填充该字段的记忆变量信息。关闭后，则需要通过手动设置。
3. 测试记忆效果输入“我是一名前端开发工程师”，等待大模型回答完毕。点击记忆，即可查看两种记忆类型：记忆片段是长期记忆功能的一部分，用于展示大模型基于对话历史自动提取的用户个性化信息。记忆变量则是您自己定义的个性化信息。此时，大模型在两种长期记忆中都保存了我们输入的信息。即使当前聊天被清除后，这些记忆也能保存到新对话中。

步骤三：体验智能体应用

您可以使用文本、语音或视频对话的方式体验智能体应用。

视频对话仅限通义千问 VL 系列模型

文本对话和文件上传

文本对话是智能体应用的核心交互方式，为您提供智能和个性化的多轮对话体验。智能体将以文本形式回复您的问题。

文本对话支持两种主要输入方式：

直接文本输入： 您可以通过键盘输入文字与智能体进行交流。
文件上传： 除了文字输入，您还可以直接上传文档、图片、视频和音频。智能体应用会自动提取文件信息，使您可以直接针对文件内容进行对话。

如需了解文件大小、格式及操作演示，请参考文件交互。

语音和视频通话

智能体应用还支持语音和视频对话：

语音对话：依托语音合成模型，智能体可以将文本回复转换为自然语音输出，您可以与智能体进行流畅的语音交流。
视频对话：依托视觉理解模型，智能体可以识别画面中的物体、场景、人物动作等，您可以与智能体进行实时视频通话。

功能亮点

全球高可用、低延迟：依托阿里云的实时音视频网络体系，全球3200+节点覆盖和QoS优化，使得用户可以在全球范围内与 AI 智能体完成音视频通话。
高度拟人化：通过持续迭代智能降噪、智能打断、智能断句等功能，使智能体在互动行为上更接近于人类，CosyVoice模型提供更加逼真的人声。
易调试：提供体验窗与调试信息展示，全流程可观测、可修改、可调试。
易体验、易集成：集成方式可参见集成方案。

说明

DeepSeek R1 系列模型不支持音频和视频对话功能；DeepSeek V3 模型不支持视频对话功能

用法说明

首先，请配置一个可正常执行的智能体。
然后，请通过体验窗 > 文本交互调试出符合预期的效果。
切换到语音交互或视频交互，配置 API-KEY。
进行音视频设置，配置参数后，在体验窗调试音视频交互效果。	其中语音转文字可进行语种选择文字转语音可进行语音模型选择和音色选择
点击右上角体验按钮，生成临时体验二维码，通过手机微信/钉钉/浏览器扫码体验交互效果。
效果确认后，点击发布按钮，进入发布渠道，完成智能媒体服务开通和SLR授权后，创建互动智能体。

说明

计费模式：百炼与视频云分别产生应用调用的账单。

百炼按照应用API调用计费（如果TTS选择百炼CosyVoice，则模型调用也会计费），详情请参见大模型产品计费说明。
视频云按照AI实时互动计费模式计费，AI实时互动每日为未订阅套餐包的用户赠送20通免费电话额度用于产品体验。详情请参见AI实时互动计费说明。

步骤四：发布智能体应用

发布后的应用可以被API调用，也可以通过Web页面分享给同一主账号下的RAM子账号使用。您可以单击智能体应用管理界面右上角的发布按钮。如果您的应用非首次发布，弹窗会向您展示当前智能体应用相比于上一次发布时的修改项。在您确认修改项后单击确认发布。

说明

如果您使用了 RAM 账号创建应用，发布应用前请确认已拥有服务关联角色权限 ram:CreateServiceLinkedRole，详情请参考服务关联角色。

如果您的应用为首次发布，则不会有弹窗信息。

通过API调用

您可以在智能体应用发布渠道页签，单击API调用右侧的查看API，查看通过API调用智能体应用的方法。

注：您需用您的API KEY对DASHSCOPE_API_KEY进行替换才可发起调用。

通过官方或魔笔渠道分享应用

单击官方或魔笔渠道右侧的图标（界面提示：已复制链接），您可以按需将该链接分享给同一主账号下的RAM子账号使用。

发布为钉钉机器人

您可以将智能体应用与钉钉机器人集成，以便通过钉钉访问和使用智能体应用。要实现此集成，您需要在钉钉平台上创建一个机器人，并将其与您的百炼应用相关联。详细的操作步骤，请参阅通过钉钉发布百炼应用。

发布为微信公众号

您可以将智能体应用与微信公众号集成，以便用户通过微信公众号访问和使用智能体应用。要实现此集成，您需要创建一个微信公众号，并将其与您的百炼应用相关联。详细的操作步骤，请参阅通过微信发布百炼应用。

在应用的发布渠道页签下，将鼠标悬停在微信公众号右侧的二维码图标上，即可显示公众号的二维码。用户可以通过微信扫一扫功能，扫描此二维码来关注您的公众号，进而访问已集成的百炼应用。

步骤五：删除与复制智能体

您可以在我的应用 > 应用列表找到已发布的应用卡片，在更多 > 复制应用/删除应用进行删除与复制智能体、修改应用名操作。

步骤六：配置内容安全和多轮对话（可选）

发布应用后，您可以在内置的安全规则基础上，自定义内容干预规则，确保大模型生成的内容安全可控。您还可以选择开启和备份多轮对话。

您可以在我的应用 > 应用列表找到已发布的应用卡片，在更多 > 高级配置配置以上功能。

使用快速干预工具处置风险内容

在使用智能体应用时，如果您希望妥善处理对话中存在潜在的违规、敏感或不当内容，可以借助快速干预工具来及时拦截和处理。该工具能够基于自定义的规则，对用户输入或模型生成的文本进行检测，一旦触发条件就会执行预先设置的干预操作。

创建输入话术规则
- 在干预输入话术面板点击创建输入话术规则，并为规则命名。
- 通过支持正则表达式的检测方式，将需要识别的违规关键词或短语添加到条件里。您可以设置单独的 AND / OR 逻辑条件组合，使规则匹配更灵活多样。
- 在触发条件时的回复中输入当用户触发风险内容时，系统需要返回的警示或替代文本。这样一来，违规内容就会被拦截并给予提示性的响应。
创建生成结果规则
- 同理，若想对模型在回复时可能出现的风险内容进行控制，则可以在干预生成结果面板添加相应规则。
- 同样地，规则以正则匹配为基础，结合多条件的 AND / OR 逻辑来判定文本风险。
- 在触发条件时的回复中配置好干预后需要返回的安全文本，或者是让系统拒绝输出某些不合规的语言。

通过以上两步，您就能够使用快速干预工具对潜在的风险内容进行一站式的拦截和替换，保证您的智能体应用在与用户交互时保持合规与安全。这样既有助于满足平台审核要求，也能为最终用户提供更健康的对话体验。

启动和备份多轮对话

智能体应用默认开启多轮对话功能。百炼提供内置缓存，用于保存多轮对话记录，有效期为会话开始后 1 小时。您也可以选择将多轮对话记录备份至 ADB-PG。

如果需要了解 ADB-PG 的更多功能与计费信息，请参阅云原生数据仓库AnalyticDB PostgreSQL版帮助文档。

配置风险内容的拦截方式

除快速干预工具外，智能体应用还内置了一套内容安全策略。当大模型生成的内容触发此策略时，智能体应用将拦截全部生成内容，并提示内容存在安全问题。

目前，百炼仅提供“全部拦截”的风险内容拦截方式，您无需手动配置此项。

下一步

百炼提供了丰富的实践教程文档，如果您想快速将百炼集成到您的业务中，请参考实践教程。

常见问题

知识库检索额外计费吗？
知识检索增强功能免费，但检索到的内容作为模型输入，按模型输入 Token 计费。
自定义插件是否有超时限制？
是，超时限制时间为 5 秒。
使用智能体应用对外提供 AI 服务，需要通过什么备案审核吗？
根据国家网信办《生成式人工智能服务管理暂行办法》，百炼智能体应用对外提供服务时，需要通过相应的备案或审核。具体备案流程和要求请参考调用通义系列大模型开发应用上架应用商店/微信小程序申请指南。
是否支持通过 API 创建智能体应用？
支持使用 Assistant API 创建大模型应用，其功能和智能体应用类似。
注意： Assistant API 创建的应用不支持控制台管理，详细信息请参阅 Assistant API 文档。