创建和管理记忆存储

更新时间:
复制为 MD 格式

记忆存储用于为智能体提供对话历史、会话状态和长期记忆的持久化能力。本文介绍如何通过控制台创建、配置和管理记忆存储实例,以及如何为智能体绑定记忆存储。

什么是记忆存储

记忆存储(MemoryCollection)是 AgentRun 为智能体提供的数据持久化服务,支持以下三种记忆类型:

  • 长期记忆:存储用户在多轮对话中积累的偏好和知识,通过大语言模型(LLM)和向量模型实现语义检索。

  • 会话历史:记录完整的对话历史,保持多轮对话的上下文连贯性。

  • 会话状态:维护对话过程中的实时状态信息,如当前任务进度、中间变量等。

创建记忆存储时,可以选择向量数据库的底层存储引擎为表格存储(OTS)或云数据库 RDS 版。两种引擎均支持长期记忆功能,但会话历史和会话状态功能仅 OTS 引擎支持。

前提条件

  • 已开通 AgentRun 服务并创建工作空间。

  • 如选择自定义 OTS 配置,需已开通表格存储 OTS 服务。

  • 如选择自定义 RDS 配置,需已创建 RDS MySQL 实例并开启向量存储功能(MySQL 8.0.30 及以上版本支持)。

  • 如开启长期记忆功能,需已配置大语言模型和向量模型服务。

通过控制台创建记忆存储

操作步骤

  1. 登录AgentRun 控制台,在左侧导航栏选择记忆

  2. 单击创建记忆存储

  3. 配置基础信息:

    • 记忆存储名称:系统自动生成 mem-xxxx 格式的名称,也可手动修改。名称需符合命名规范。

    • 描述:可选,填写记忆存储的用途说明。

  4. 配置向量数据库。支持两种配置方式:

    • 自动配置(推荐):系统自动创建 OTS 实例并完成配置,一键部署。

    • 自定义配置:手动选择向量数据库类型(OTS 或 RDS)并填写详细参数。详见下方向量数据库配置参数

  5. (可选)配置模型参数。开启长期记忆功能后,需配置大语言模型、向量模型和执行角色。详见下方模型配置

  6. 配置功能开关。根据需要开启会话历史会话状态功能。

    重要

    会话历史和会话状态功能仅OTS 类型的记忆存储支持。选择 RDS 类型的向量数据库时,不展示这两个开关。

  7. 配置网络。支持公网专有网络两种网络类型。选择 RDS 类型时,网络类型强制为专有网络。详见下方网络配置

  8. 确认配置信息无误后,单击开始部署

向量数据库配置参数

OTS 配置

选择自定义配置OTS时,需配置以下参数:

参数

说明

示例值

OTS 实例

选择已创建的表格存储实例。每个实例只能被一个记忆存储绑定。

my-ots-instance

表名

系统默认为 mem0,无需修改。表名必须以字母或下划线开头,可包含字母、数字和下划线。

mem0

向量维度

根据所选向量模型自动设置,取值范围 64~2048。

1536

RDS 配置

选择自定义配置RDS时,需配置以下参数:

参数

说明

示例值

RDS 实例

选择已开启向量存储功能的 RDS MySQL 实例。未开启向量存储的实例不可选。

rm-bp1xxxxx

数据库名称

选择 RDS 实例下的目标数据库。

my_database

表名

自定义表名,用于存储记忆数据。必须以字母或下划线开头,可包含字母、数字和下划线。

mem0

用户名

RDS 数据库的访问用户名。

admin

访问凭证

RDS 模式下强制启用。可选择已有凭证或创建新凭证,用于安全存储数据库密码。

my-credential

端口

RDS 数据库的连接端口,默认 3306。

3306

向量维度

根据所选向量模型自动设置,也可手动输入。取值范围 64~2048。

1536

说明

RDS 实例必须已开启向量存储功能。如尚未开启,可前往 RDS 控制台开通向量存储

模型配置

开启长期记忆功能后,需配置大语言模型(LLM)和向量模型(Embedding),用于记忆的语义理解和向量化。

大语言模型配置

参数

说明

示例

模型服务

选择已配置的模型服务提供商,如百炼、OpenAI 等。

百炼

具体模型

选择具体的模型名称,如 qwen-plus、qwen-max 等。

qwen-plus

向量模型配置

参数

说明

示例

模型服务

选择已配置的向量模型服务提供商。

百炼

具体模型

选择具体的向量模型名称。不同模型支持的向量维度不同,会影响向量数据库的维度配置。

text-embedding-v4

向量模型维度兼容性

不同向量模型支持的向量维度如下表所示。选择模型后,系统会自动设置默认维度,也可在 RDS 自定义配置时手动调整(需在模型支持的维度范围内)。

向量模型

支持的维度

默认维度

text-embedding-v4

2048、1536、1024、768、512、256、128、64

1536

text-embedding-v3

1024、768、512、256、128、64

768

text-embedding-v2

1536

1536

text-embedding-v1

1536

1536

执行角色

开启长期记忆功能时,必须配置执行角色(ExecutionRoleArn),用于授权 AgentRun 服务访问模型服务和向量数据库。选择已有角色或创建新角色。

网络配置

网络配置用于控制记忆存储实例的网络访问方式。支持以下两种网络类型:

网络类型

说明

配置项

公网

通过公网访问,无需额外网络配置。自动配置模式下默认使用此方式。

无需配置

专有网络

通过 VPC 内网访问,延迟更低、安全性更高。选择 RDS 类型时强制使用此方式。

VPC ID、交换机(VSwitch)、安全组

说明

选择 RDS 类型的向量数据库时,网络类型强制为专有网络,且 VPC 需与 RDS 实例所在的 VPC 一致。

开启会话历史和会话状态

在创建记忆存储时,可以开启以下两项功能:

  • 会话历史:记录完整的对话历史,包括用户输入和智能体回复。开启后,智能体可以在多轮对话中保持上下文连贯。

  • 会话状态:维护对话过程中的实时状态信息,如任务进度、中间变量等。开启后,智能体可以追踪和管理对话过程中的状态变化。

警告

会话历史和会话状态功能创建后不可关闭。请在创建前根据实际需求决定是否开启。

重要

会话历史会话状态功能仅OTS 类型的记忆存储支持。选择 RDS 类型时,不展示这两个功能开关。

编辑记忆存储

可以修改记忆存储的部分配置信息,包括描述、网络配置等。

  1. 记忆存储列表中,找到目标记忆存储。

  2. 单击记忆存储名称,进入详情页。

  3. 概览页签中,找到需要修改的配置项,单击对应区域的编辑图标进行修改。

  4. 修改完成后,保存配置。

说明

部分核心配置(如向量数据库类型、向量数据库实例)创建后不可修改。

重置记忆存储

重置功能用于清除记忆存储中的所有数据(如会话历史、会话状态和长期记忆数据),但保留配置信息。重置后,记忆存储将恢复到初始状态,可以重新开始使用。

  1. 在记忆存储详情页中,找到重置操作入口。

  2. 在弹出的确认对话框中,确认重置操作的影响范围。

  3. 确认后,系统将清除所有记忆数据。

删除记忆存储

警告

删除记忆存储是不可逆操作,所有关联数据(包括长期记忆、会话历史、会话状态等)将被永久删除,且无法恢复。请谨慎操作。

  1. 记忆存储列表中,找到目标记忆存储。

  2. 在操作列中,单击删除

  3. 在弹出的确认对话框中,输入记忆存储名称进行二次确认。

  4. 单击确认删除记忆存储,等待删除完成。

为智能体绑定记忆存储

创建记忆存储后,可以在智能体创建或配置页面为其绑定记忆存储,使智能体具备持久化记忆的能力。

  1. 在创建或编辑智能体时,找到上下文资源配置区域。

  2. 在记忆存储绑定区域,从右侧可选列表中选择已创建的记忆存储,单击添加按钮将其添加到已绑定列表。

  3. 如需解除绑定,在已绑定列表中单击对应记忆存储右侧的移除按钮。

记忆类型标签

在绑定列表中,每个记忆存储会显示一个类型标签,标识其主要功能类型。标签由系统根据记忆存储的配置自动推断:

记忆类型

推断条件

说明

session

开启了会话历史功能

保持对话上下文的一致性,适用于多轮对话场景。

knowledge

配置了向量数据库存储

结构化知识存储,通过向量检索实现语义化记忆召回。

longterm

未开启会话历史且未配置向量数据库(默认类型)

长期记忆持久化管理,存储用户跨会话的偏好和知识。