应用构建操作说明_大模型服务平台百炼(Model Studio)-阿里云帮助中心

备案控制台

文档

输入文档关键字查找

定义

阿里云百炼应用基于Assistant API技术架构，结合大语言模型（LLM）的推理、知识检索增强、插件调度等能力，构建应对各类复杂场景任务的场景应用。通过集成化、直观易用的产品界面，为开发者提供了丰富的应用配置选项，包括大型语言模型（LLM）选择、Prompt工程、知识检索增强、插件调度、流程调度等功能。

为了确保智能体的稳定性和功能性，应用还内置了一套完整的测试环境，允许开发者在部署前对其进行全面的功能验证和性能调试，提升整体项目质量和用户体验。

同时，阿里云百炼还开放了应用所使用的Assistant API，您同样可以通过Assistant API搭建应用。最佳实践请参考：最佳实践。

操作说明

阿里云百炼提供应用的多个配置入口，路径分别是：

产品首页-应用创建-立即创建

应用中心-我的应用-新增应用

在上述两个入口均可以创建应用，创建过程相同。下面介绍应用的配置方法。

1、选择大语言模型

进入创建应用页面后，首先选择本应用所需使用的大语言模型。该模型将作为智能体的“大脑”，根据用户的提问决策是否调用知识检索增强、插件或者基于模型的世界知识直接生成答案。

支持的模型参数配置如下：

温度系数：用于调控生成的多样性。
最长回复长度：模型生成的长度限制，不包含prompt。允许的最大长度因模型不同有所改变。
携带上下文轮数：设置输入模型的最大历史对话轮数，轮数越多，对话相关性越强。

说明

目前百炼应用仅支持通义千问系列的Turbo、Plus和Max模型，后续会逐渐开放更多通义系列模型、第三方模型和用户自训练的模型。

2、配置Prompt

选择好大语言模型后，您可以配置该应用的Prompt，例如：您可以在这里描述智能体的人设、功能、所具备的能力等内容。在实际调用过程中，以上信息将作为System Prompt传入大语言模型。

如果您开启了知识检索增强或长期记忆功能，对应的Prompt也将展示在这里，便于您调整Prompt从而更灵活地控制最终生成结果。

同时，我们提供Prompt优化功能，辅助您编写Prompt。您可以在Prompt输入框初步输入您的需求，然后点击“Prompt优化”按钮，系统将自动帮您生成更完善的Prompt，您可以在Prompt优化框中调整生成内容或者直接使用。

3、知识检索增强

百炼将知识检索增强功能进行了全面升级，整合到了应用配置中，您可以在应用中通过打开知识检索增强开关，快速实现一款知识检索增强应用。当您打开知识检索增强功能后，系统自动将相应的system prompt添加到上方的Prompt编辑框中。

知识检索增强支持知识库配置和检索片段数配置，其中：

选择知识库：选择配置好的知识库，用于设置知识检索范围。
检索片段数：支持召回的最大检索片段数量。

4、长期记忆

长期记忆功能是针对终端用户提供的一项个性化功能，系统将根据对话历史自动生成用户画像并回答问题。如果您通过API调用，请切记传入memoryID用来指定对应的终端用户，否则该功能将不生效。

说明

该功能仍处在优化阶段，如果您需要使用请点击页面中的“申请”按钮，申请通过后即可以限时免费使用。

62d2d48de1274bc17fa6ad14069f271f

5、选择插件

应用很重要的功能之一就是允许大语言模型利用插件获得更多业务能力，例如您可以选择官方的“夸克搜索”插件使智能体具有获取实时信息的能力，您也可以选择官方的“图片生成”插件使智能体具有文字生成图片的能力。

除此之外，您也可以配置自定义业务插件，接入您的业务系统功能。

6、选择流程

为了更好地控制大模型应用的执行过程和生成结果，您可以通过业务流程对每一步进行配置。在应用中，您可以选择配置好的业务流程（最多支持选择1个流程），在大模型需要的时候调用该流程执行相应的业务流程。流程组件配置请参考流程管理查看详情。

7、高级配置

快速干预

您可以通过快速干预功能调整应用的输出结果。该功能仅通过规则方式快速处理用户输入的违规话术或者大模型生成的风险内容，该工具无法替代内容安全检测类的专业产品。

多轮对话

通过内置缓存支持多轮对话：该功能支持将对话内容缓存或做持久化处理。对于持久化处理，需要选择您的存储实例，系统会将数据存储到您的存储实例中。

通过ADB-PG备份会话记录：内置缓存的数据默认不会落盘存储，只在内存中存储1小时。打开此开关并选择已购买的ADB-PG实例，可自动将此应用的对话记录存储到对应的ADB-PG实例中（需要付费购买ADB-PG实例，如已购买可直接关联）。

8、应用测试

目前应用测试支持测试和发布两个版本，都可以用来进行模型效果验证。

测试版本：当您在配置应用信息时，系统会自动保存为草稿版本；

发布版本：点击右上角的发布按钮，变成发布版本。

如您在测试过程中可以在模型回复的内容中查看模型回复的debug过程。

重要

应用在测试和调用过程中，将以所选的大语言模型的Token消耗进行计费，首先通过免费额度进行抵扣，免费额度消耗完即开始正常计费。

上一篇：我的应用下一篇：知识检索增强（RAG）

文档内容是否对您有帮助？