您可以在百炼控制台以零代码的方式快速创建智能体应用,并将RAG(Retrieval-Augmented Generation,检索增强生成)以及插件能力集成进来。应用创建完成后,您可以通过控制台或API的方式来使用。
为什么使用智能体应用
大模型具有强大的语言理解和生成能力,然而大模型有一定局限性,如:
无法回答私有领域问题,如公司制度、人员信息等;
无法及时获取最新消息,如实时天气、比赛结果等;
无法准确回答专业问题,如数学计算、图像生成等。
您可以使用智能体应用来解决这些问题。智能体应用是以大模型为基础,根据业务场景集成特定外部能力的应用。
此处外部能力含义为:大模型本身不具备的能力。如获取实时信息、回答私有领域问题等。
您可以在百炼控制台通过零代码的方式创建智能体应用,并将外部能力集成到应用中,解决您的业务问题。
智能体应用有许多使用场景,如:
私有领域知识问答
您只需准备好知识库文件,便可以在百炼控制台快速创建一个私有领域知识问答应用,将其应用到如公司制度、人员信息等问答场景。
个性化聊天机器人
百炼提供了长期记忆功能,可以保存关键的历史对话信息,为您提供个性化的聊天体验。此外,百炼集成了夸克搜索和图像生成等插件,可以扩展聊天机器人的功能。
智能助手
通过引入RAG能力、长期记忆以及自定义插件等能力,您可以构建一个智能助手,帮助您提升工作效率,如处理邮件、撰写周报等。
应用类型
百炼支持普通智能体应用和RAG智能体应用。两种应用的功能完全相同,仅针对使用场景优化了用户界面。
如果您需要智能体回答私有知识问题,建议使用 RAG 智能体应用。如果您不确定具体的使用场景,建议使用普通智能体应用。
普通智能体应用 | RAG智能体应用 |
普通智能体应用 | RAG智能体应用 |
适用于各类任务的用户界面 默认不启用扩展功能 | 针对“私有知识问答”优化的用户界面 默认已启用“知识检索增强”功能 |
支持的模型
数据更新可能存在延迟,模型的支持情况以智能体应用内显示为准。
模型系列 | 模型名称 |
模型系列 | 模型名称 |
通义千问 | 通义千问-Max 通义千问-Max-Latest 通义千问-Max-2024-09-19 通义千问-Plus 通义千问-Plus-Latest 通义千问-Plus-2025-01-25 通义千问-Plus-2024-07-23 通义千问-Plus-2024-08-06 通义千问-Plus-2024-09-19 通义千问-Plus-2024-11-25 通义千问-Plus-2024-11-27 通义千问-Plus-2024-12-20 通义千问-Plus-2025-01-12 通义千问-Turbo 通义千问-Turbo-Latest 通义千问-Turbo-2024-09-19 通义千问-Turbo-2024-06-24 |
通义千问VL | 通义千问VL-Plus-Latest 通义千问VL-Plus-2025-01-25 通义千问VL-Max 通义千问VL-Max-Latest 通义千问VL-Max-2024-10-30 通义千问VL-Max-2024-11-19 通义千问VL-Max-2024-12-30 通义千问VL-Plus-2024-08-09 通义千问VL-Plus-2025-01-02 |
通义千问2.5 开源 | 通义千问2.5-14B-1M 通义千问2.5-72B 通义千问2.5-32B 通义千问2.5-14B 通义千问2.5-3B 通义千问2.5-1.5B 通义千问2.5-0.5B 通义千问2.5-7B |
通义千问2 开源 | 通义千问2-72B 通义千问2-57B 通义千问2-7B |
DeepSeek | DeepSeek-V3 DeepSeek-R1 DeepSeek-R1-Distill-Qwen-32B DeepSeek-R1-Distill-Qwen-14B DeepSeek-R1-Distill-Qwen-7B |
通义法睿 | 通义法睿-Plus-32K |
通义千问-Long | Qwen-Long |
Llama | Llama-3.1-405B-Instruct Llama-3.1-70B-Instruct Llama-3.1-8B-Instruct |
零一万物 | Yi-Large |
MiniMax | MiniMax abab6.5s-245k |
步骤一:创建智能体应用
1. 创建应用访问百炼控制台我的应用,单击新增应用,在智能体应用页签,单击直接创建。 如果您之前已创建过应用,则单击右上角的新增应用。 | |
2. 选择大模型并配置参数进入智能体应用管理界面后,您需要进行大模型的选择与参数配置。您可以参考右图,单击设置,并在模型选择的下拉菜单中选择模型,此处选择通义千问-Max。您可以根据需求进行模型参数的配置,参数详情请将鼠标移动到 DeepSeek-R1 系列模型暂不支持设置温度系数。 | |
3. 测试应用选择大模型之后,您就在百炼创建完成了一个智能体应用。您可以输入问题进行测试。 |
步骤二:拓展智能体应用的能力
您可以在智能体应用管理界面,通过设置Prompt、添加RAG与插件等方法拓展智能体应用的能力。
系统提示词(System Prompt):指引内容生成方向
您可以在智能体应用管理界面中输入Prompt来指引应用生成内容的方向。例如设置Prompt为:
输入“你好”,智能体应用的输出如右图。 针对 DeepSeek R1 系列模型,DeepSeek官方不建议设置 系统提示词,原文如下:"Avoid adding a system prompt; all instructions should be contained within the user prompt." |
知识检索增强(RAG):提升私域知识问答能力
RAG (Retrieval-Augmented Generation) 是一种检索技术,它通过自动检索相关文档内容,并将这些信息作为上下文输入给智能体,从而提高智能体的回复准确率。特别是在处理私有知识或垂直领域问答时,RAG能显著提升智能体的效果。
提示: RAG 检索到的文本也会占用大模型的上下文窗口长度(Context Window),因此需要根据实际情况调整检索策略和文本长度,以充分利用上下文窗口并避免超出限制。
1. 上传数据访问数据管理,单击导入数据。此处选择百炼系列手机产品介绍.docx作为知识库文件。在导入数据界面,将文件通过本地上传方式导入。 | |
2. 创建知识库
| |
3. 在应用中集成RAG
|
插件:接入联网搜索、代码执行等更多效率工具
插件可以使智能体应用更高效、更专业地应用到业务场景中。百炼提供了多种官方插件。您可以在智能体应用管理界面单击选择插件,便可以在插件广场栏中选择一个或多个插件。
同时您也可以添加自定义插件,详情请查看插件概述。
DeepSeek 系列模型暂不支持插件,包括“夸克搜索”在内的联网搜索插件目前无法使用。
1. 添加插件此处以图片生成插件为例,选择对应插件后,单击确认。 | |
2. 测试插件效果添加插件后,向输入框输入: 画一只猫。 智能体应用的回复如右图,可以看到智能体应用调用了图像生成插件(即text_to_image)。 | |
3. 使用更多插件您可以在同一个智能体应用中选择最多10个插件。智能体应用会根据输入选择使用一个或多个插件。比如提问: 查一下杭州明天的天气,并将这个天气的西湖画出来。 智能体应用会输出如右图的内容。 |
长期记忆:保存个性化信息
智能体应用具备短期对话记忆能力,但受限于大模型注意力机制,可能无法长时间保持上下文连贯性。 长期记忆功能允许大模型自动存储个性化信息,确保智能体应用在后续对话中能够持续调用和参考这些信息,提升对话的个性化和连贯性。
详细的功能介绍请参考长期记忆 文档。
1. 开启长期记忆在智能体应用编辑界面,开启长期记忆功能开关。 | |
2. 配置用户画像点击记忆变量配置,添加新的记忆变量字段,点击右上角发布应用。 字段是记忆变量的属性,例如“岗位”、“行业”、“兴趣爱好”等。 字段描述用于解释字段名称,帮助大模型更好地理解字段的含义。 是否通过模型推理控制该字段是否参与模型推理。开启后,系统会根据对话内容自动推理和填充该字段的记忆变量信息。关闭后,则需要通过手动设置。 | |
3. 测试记忆效果输入“我是一名前端开发工程师”,等待大模型回答完毕。 点击记忆,即可查看两种记忆类型:
此时,大模型在两种长期记忆中都保存了我们输入的信息。即使当前聊天被清除后,这些记忆也能保存到新对话中。 |
步骤三:体验智能体应用
您可以使用文本、语音或视频对话的方式体验智能体应用。
视频对话仅限通义千问 VL 系列模型
文本对话和文件上传
文本对话是智能体应用的核心交互方式,为您提供智能和个性化的多轮对话体验。智能体将以文本形式回复您的问题。
文本对话支持两种主要输入方式:
直接文本输入: 您可以通过键盘输入文字与智能体进行交流。
文件上传: 除了文字输入,您还可以直接上传文档、图片、视频和音频。智能体应用会自动提取文件信息,使您可以直接针对文件内容进行对话。
如需了解文件大小、格式及操作演示,请参考文件交互。
语音和视频通话
智能体应用还支持语音和视频对话:
功能亮点
全球高可用、低延迟:依托阿里云的实时音视频网络体系,全球3200+节点覆盖和QoS优化,使得用户可以在全球范围内与 AI 智能体完成音视频通话。
高度拟人化:通过持续迭代智能降噪、智能打断、智能断句等功能,使智能体在互动行为上更接近于人类,CosyVoice模型提供更加逼真的人声。
易调试:提供体验窗与调试信息展示,全流程可观测、可修改、可调试。
易体验、易集成:集成方式可参见集成方案。
DeepSeek R1 系列模型不支持音频和视频对话功能;DeepSeek V3 模型不支持视频对话功能
用法说明
| |
| |
| |
| 其中语音转文字可进行语种选择 |
| |
|
计费模式:百炼与视频云分别产生应用调用的账单。
百炼按照应用API调用计费(如果TTS选择百炼CosyVoice,则模型调用也会计费),详情请参见大模型产品计费说明。
视频云按照AI实时互动计费模式计费,AI实时互动每日为未订阅套餐包的用户赠送20通免费电话额度用于产品体验。详情请参见AI实时互动计费说明。
步骤四:发布智能体应用
发布后的应用可以被API调用,也可以通过Web页面分享给同一主账号下的RAM子账号使用。您可以单击智能体应用管理界面右上角的发布按钮。如果您的应用非首次发布,弹窗会向您展示当前智能体应用相比于上一次发布时的修改项。在您确认修改项后单击确认发布。
如果您使用了 RAM 账号创建应用,发布应用前请确认已拥有服务关联角色权限 ram:CreateServiceLinkedRole
,详情请参考服务关联角色。
如果您的应用为首次发布,则不会有弹窗信息。
通过API调用
您可以在智能体应用发布渠道页签,单击API调用右侧的查看API,查看通过API调用智能体应用的方法。
注:您需用您的API KEY对DASHSCOPE_API_KEY进行替换才可发起调用。
通过官方或魔笔渠道分享应用
单击官方或魔笔渠道右侧的图标(界面提示:已复制链接),您可以按需将该链接分享给同一主账号下的RAM子账号使用。
发布为钉钉机器人
您可以将智能体应用与钉钉机器人集成,以便通过钉钉访问和使用智能体应用。要实现此集成,您需要在钉钉平台上创建一个机器人,并将其与您的百炼应用相关联。详细的操作步骤,请参阅 通过钉钉发布百炼应用。
发布为微信公众号
您可以将智能体应用与微信公众号集成,以便用户通过微信公众号访问和使用智能体应用。要实现此集成,您需要创建一个微信公众号,并将其与您的百炼应用相关联。详细的操作步骤,请参阅 通过微信发布百炼应用。
在应用的发布渠道页签下,将鼠标悬停在微信公众号右侧的二维码图标上,即可显示公众号的二维码。用户可以通过微信扫一扫功能,扫描此二维码来关注您的公众号,进而访问已集成的百炼应用。
步骤五:删除与复制智能体
您可以在
找到已发布的应用卡片,在 进行删除与复制智能体、修改应用名操作。步骤六:配置内容安全和多轮对话(可选)
发布应用后,您可以在内置的安全规则基础上,自定义内容干预规则,确保大模型生成的内容安全可控。您还可以选择开启和备份多轮对话。
您可以在
找到已发布的应用卡片,在 配置以上功能。使用快速干预工具处置风险内容
在使用智能体应用时,如果您希望妥善处理对话中存在潜在的违规、敏感或不当内容,可以借助快速干预工具来及时拦截和处理。该工具能够基于自定义的规则,对用户输入或模型生成的文本进行检测,一旦触发条件就会执行预先设置的干预操作。
通过以上两步,您就能够使用快速干预工具对潜在的风险内容进行一站式的拦截和替换,保证您的智能体应用在与用户交互时保持合规与安全。这样既有助于满足平台审核要求,也能为最终用户提供更健康的对话体验。
启动和备份多轮对话
智能体应用默认开启多轮对话功能。百炼提供内置缓存,用于保存多轮对话记录,有效期为会话开始后 1 小时。您也可以选择将多轮对话记录备份至 ADB-PG。
如果需要了解 ADB-PG 的更多功能与计费信息,请参阅云原生数据仓库AnalyticDB PostgreSQL版 帮助文档。
配置风险内容的拦截方式
除快速干预工具外,智能体应用还内置了一套内容安全策略。当大模型生成的内容触发此策略时,智能体应用将拦截全部生成内容,并提示内容存在安全问题。
目前,百炼仅提供“全部拦截”的风险内容拦截方式,您无需手动配置此项。
下一步
百炼提供了丰富的实践教程文档,如果您想快速将百炼集成到您的业务中,请参考实践教程。
常见问题
知识库检索额外计费吗?
知识检索增强功能免费,但检索到的内容作为模型输入,按模型输入 Token 计费。
自定义插件是否有超时限制?
是,超时限制时间为 5 秒。
使用智能体应用对外提供 AI 服务,需要通过什么备案审核吗?
根据国家网信办《生成式人工智能服务管理暂行办法》,百炼智能体应用对外提供服务时,需要通过相应的备案或审核。具体备案流程和要求请参考调用通义系列大模型开发应用上架应用商店/微信小程序申请指南。
是否支持通过 API 创建智能体应用?
支持使用 Assistant API 创建大模型应用,其功能和智能体应用类似。
注意: Assistant API 创建的应用不支持控制台管理,详细信息请参阅 Assistant API 文档。
- 本页导读 (1)
- 为什么使用智能体应用
- 应用类型
- 支持的模型
- 步骤一:创建智能体应用
- 1. 创建应用
- 2. 选择大模型并配置参数
- 3. 测试应用
- 步骤二:拓展智能体应用的能力
- 系统提示词(System Prompt):指引内容生成方向
- 知识检索增强(RAG):提升私域知识问答能力
- 插件:接入联网搜索、代码执行等更多效率工具
- 长期记忆:保存个性化信息
- 步骤三:体验智能体应用
- 文本对话和文件上传
- 语音和视频通话
- 步骤四:发布智能体应用
- 通过API调用
- 通过官方或魔笔渠道分享应用
- 发布为钉钉机器人
- 发布为微信公众号
- 步骤五:删除与复制智能体
- 步骤六:配置内容安全和多轮对话(可选)
- 使用快速干预工具处置风险内容
- 启动和备份多轮对话
- 配置风险内容的拦截方式
- 下一步
- 常见问题