记忆存储概述

更新时间:
复制 MD 格式

无记忆的智能体每次对话都从零开始,无法识别用户的历史偏好和之前的对话内容。记忆存储为智能体提供持久化记忆管理服务,通过长期记忆、会话历史和会话状态三种能力,实现个性化响应、多轮对话和断点续传。本文介绍记忆存储的核心概念、能力对比和选型指南。

什么是记忆存储

记忆存储是智能体的持久化记忆管理服务,用于保存和检索与用户交互相关的上下文数据。开启记忆存储后,智能体能够记住用户说过的话、偏好的风格和之前达成的共识,从而提供连续且个性化的交互体验。

记忆存储的组件关系如下:

组件

职责

存储数据

智能体运行时(AgentRuntime)

提供记忆存储的底层能力

记忆存储实例

统一管理记忆数据,创建时选择 OTS 或 RDS 后端存储

长期记忆(用户偏好、历史片段)、会话历史(完整对话消息)、会话状态(单次会话上下文快照)

智能体

创建智能体时绑定记忆存储实例,运行过程中自动读写记忆数据

绑定记忆存储实例后,智能体即可在运行过程中自动读写记忆数据,无需在业务代码中额外实现记忆管理逻辑。

三种记忆能力

记忆存储提供三种互补的记忆能力,分别满足不同的上下文管理需求。

长期记忆

长期记忆支持跨会话保存和检索用户偏好、历史信息等上下文数据。通过向量检索技术,智能体能够从海量记忆中找到与当前对话最相关的片段,实现真正的会话连续性。适用于用户画像构建、个性化推荐和长期偏好记忆等场景。

详细信息,请参见长期记忆

会话历史

会话历史记录完整的对话消息,支持上下文回溯,便于追溯智能体与用户的多轮交互过程。此功能仅在使用 OTS 存储后端时可用。

详细信息,请参见会话历史

会话状态

会话状态提供单次会话内的上下文管理能力,支持在智能体执行过程中保存和恢复对话状态。通过与主流开源框架(LangChain、Google ADK(Agent Development Kit)、LangGraph)的集成,可实现可靠的多轮对话和断点续传。

详细信息,请参见会话状态

能力对比

三种记忆能力在存储类型、支持框架、搜索方式和典型场景上存在差异,可根据实际需求组合使用。

存储类型

支持框架

数据粒度

典型场景

长期记忆

MCP(Model Context Protocol)工具、LangChain

用户级偏好、历史片段

个性化推荐、用户画像、跨会话偏好记忆

会话历史

智能体运行时内置

完整对话消息

对话审计、交互追溯、质量分析

会话状态

LangChain、Google ADK(Agent Development Kit)、LangGraph

单次会话上下文快照

断点续传、多轮任务、中断恢复

OTS 与 RDS 存储选型

创建记忆存储实例时,需要选择后端存储类型。OTS(表格存储)和 RDS(关系型数据库)在性能、成本和功能支持上存在差异。

对比维度

OTS(表格存储)

RDS(关系型数据库)

支持能力

长期记忆、会话历史、会话状态

仅长期记忆

向量检索

支持

支持

扩展性

自动水平扩展,适合海量数据

垂直扩展为主,适合中小规模

成本

按量付费,数据量大时更具成本优势

实例计费,适合已有 RDS 资源的场景

推荐场景

大规模生产环境、需要会话历史能力

开发测试、已有 RDS 基础设施复用

说明

会话历史功能仅支持 OTS 存储后端。如果需要完整的对话消息记录和追溯能力,请选择 OTS 类型。

计费说明

OTS 和 RDS 采用不同的计费方式。OTS 按存储容量和读写次数计费,RDS 按实例规格计费。

快速入门

根据使用场景,选择合适的入门路径:

创建记忆存储实例

首次使用记忆存储,需要先创建记忆存储实例并选择存储类型。创建过程中可配置存储容量、读写权限和关联的智能体。

详细信息,请参见创建和管理记忆存储

启用长期记忆实现个性化对话

需要智能体记住用户偏好和历史交互时,启用长期记忆。通过 MCP(Model Context Protocol)工具或 LangChain 集成,将记忆存储接入智能体工作流。

详细信息,请参见长期记忆

配置会话状态实现断点续传

需要智能体在对话中断后恢复上下文时,启用会话状态。配合 LangChain、Google ADK(Agent Development Kit)或 LangGraph 框架使用。

详细信息,请参见会话状态

查看会话历史进行交互追溯

需要审计或追溯智能体与用户的完整对话过程时,使用会话历史。此功能仅在使用 OTS 存储时可用。

详细信息,请参见会话历史

前提条件

使用记忆存储前,需要完成以下准备工作:

  • 已为 RAM 用户授予智能体运行时(AgentRuntime)的相关权限,至少包含 AliyunAgentRuntimeFullAccess 权限策略。缺少必要权限时,创建和管理记忆存储实例会报权限错误。授权操作请参见 RAM 用户授权文档。

  • 如计划使用 LangChain、Google ADK 等开源框架集成,已安装对应框架的 SDK 并完成基础配置。

相关文档

记忆存储相关文档按以下结构组织,按需查阅: