无记忆的智能体每次对话都从零开始,无法识别用户的历史偏好和之前的对话内容。记忆存储为智能体提供持久化记忆管理服务,通过长期记忆、会话历史和会话状态三种能力,实现个性化响应、多轮对话和断点续传。本文介绍记忆存储的核心概念、能力对比和选型指南。
什么是记忆存储
记忆存储是智能体的持久化记忆管理服务,用于保存和检索与用户交互相关的上下文数据。开启记忆存储后,智能体能够记住用户说过的话、偏好的风格和之前达成的共识,从而提供连续且个性化的交互体验。
记忆存储的组件关系如下:
|
组件 |
职责 |
存储数据 |
|
智能体运行时(AgentRuntime) |
提供记忆存储的底层能力 |
— |
|
记忆存储实例 |
统一管理记忆数据,创建时选择 OTS 或 RDS 后端存储 |
长期记忆(用户偏好、历史片段)、会话历史(完整对话消息)、会话状态(单次会话上下文快照) |
|
智能体 |
创建智能体时绑定记忆存储实例,运行过程中自动读写记忆数据 |
— |
绑定记忆存储实例后,智能体即可在运行过程中自动读写记忆数据,无需在业务代码中额外实现记忆管理逻辑。
三种记忆能力
记忆存储提供三种互补的记忆能力,分别满足不同的上下文管理需求。
长期记忆
长期记忆支持跨会话保存和检索用户偏好、历史信息等上下文数据。通过向量检索技术,智能体能够从海量记忆中找到与当前对话最相关的片段,实现真正的会话连续性。适用于用户画像构建、个性化推荐和长期偏好记忆等场景。
详细信息,请参见长期记忆。
会话历史
会话历史记录完整的对话消息,支持上下文回溯,便于追溯智能体与用户的多轮交互过程。此功能仅在使用 OTS 存储后端时可用。
详细信息,请参见会话历史。
会话状态
会话状态提供单次会话内的上下文管理能力,支持在智能体执行过程中保存和恢复对话状态。通过与主流开源框架(LangChain、Google ADK(Agent Development Kit)、LangGraph)的集成,可实现可靠的多轮对话和断点续传。
详细信息,请参见会话状态。
能力对比
三种记忆能力在存储类型、支持框架、搜索方式和典型场景上存在差异,可根据实际需求组合使用。
|
存储类型 |
支持框架 |
搜索方式 |
数据粒度 |
典型场景 |
|
长期记忆 |
MCP(Model Context Protocol)工具、LangChain |
向量检索 |
用户级偏好、历史片段 |
个性化推荐、用户画像、跨会话偏好记忆 |
|
会话历史 |
智能体运行时内置 |
按会话 ID 和时间范围查询 |
完整对话消息 |
对话审计、交互追溯、质量分析 |
|
会话状态 |
LangChain、Google ADK(Agent Development Kit)、LangGraph |
按会话 ID 精确读取 |
单次会话上下文快照 |
断点续传、多轮任务、中断恢复 |
OTS 与 RDS 存储选型
创建记忆存储实例时,需要选择后端存储类型。OTS(表格存储)和 RDS(关系型数据库)在性能、成本和功能支持上存在差异。
|
对比维度 |
OTS(表格存储) |
RDS(关系型数据库) |
|
支持能力 |
长期记忆、会话历史、会话状态 |
仅长期记忆 |
|
向量检索 |
支持 |
支持 |
|
扩展性 |
自动水平扩展,适合海量数据 |
垂直扩展为主,适合中小规模 |
|
成本 |
按量付费,数据量大时更具成本优势 |
实例计费,适合已有 RDS 资源的场景 |
|
推荐场景 |
大规模生产环境、需要会话历史能力 |
开发测试、已有 RDS 基础设施复用 |
会话历史功能仅支持 OTS 存储后端。如果需要完整的对话消息记录和追溯能力,请选择 OTS 类型。
计费说明
OTS 和 RDS 采用不同的计费方式。OTS 按存储容量和读写次数计费,RDS 按实例规格计费。
快速入门
根据使用场景,选择合适的入门路径:
创建记忆存储实例
首次使用记忆存储,需要先创建记忆存储实例并选择存储类型。创建过程中可配置存储容量、读写权限和关联的智能体。
详细信息,请参见创建和管理记忆存储。
启用长期记忆实现个性化对话
需要智能体记住用户偏好和历史交互时,启用长期记忆。通过 MCP(Model Context Protocol)工具或 LangChain 集成,将记忆存储接入智能体工作流。
详细信息,请参见长期记忆。
配置会话状态实现断点续传
需要智能体在对话中断后恢复上下文时,启用会话状态。配合 LangChain、Google ADK(Agent Development Kit)或 LangGraph 框架使用。
详细信息,请参见会话状态。
查看会话历史进行交互追溯
需要审计或追溯智能体与用户的完整对话过程时,使用会话历史。此功能仅在使用 OTS 存储时可用。
详细信息,请参见会话历史。
前提条件
使用记忆存储前,需要完成以下准备工作:
-
已为 RAM 用户授予智能体运行时(AgentRuntime)的相关权限,至少包含
AliyunAgentRuntimeFullAccess权限策略。缺少必要权限时,创建和管理记忆存储实例会报权限错误。授权操作请参见 RAM 用户授权文档。 -
如计划使用 LangChain、Google ADK 等开源框架集成,已安装对应框架的 SDK 并完成基础配置。